通用问题#
Q:Nexhina 和 OpenAI 官方有什么区别?
A:Nexhina 是兼容 OpenAI 格式的网关,多了国产模型支持(DeepSeek/Qwen/GLM等),价格更灵活。接口格式完全兼容,OpenAI SDK 直接用。Q:支持哪些编程语言?
A:任何支持 HTTP 的语言都能调。Python 和 Node.js 有官方 SDK 最方便,其他语言(Go/Java/PHP/Rust)用 HTTP 客户端直接请求即可。Q:可以免费试用吗?
A:联系管理员获取测试 Key,一般会有初始额度。调用问题#
Q:返回 context_length_exceeded 怎么办?
A:输入太长了。精简 messages 内容,或换上下文更长的模型(如 gpt-4.1 支持 1M)。Q:返回 model_not_found 怎么办?
A:model 参数写错了。调用 GET /v1/models 查看可用模型列表,注意大小写。Q:流式输出中断了怎么办?
A:网络问题导致 SSE 断连,无法续传,需要重新发起请求。建议客户端做拼接逻辑,断流后重新请求。Q:为什么回复内容被截断?
A:可能是 max_tokens 设太小,或模型输出达到上限。检查 finish_reason,如果是 length 说明被截断了,加大 max_tokens。Q:中文回复质量不好怎么办?
A:试试在 system 消息中明确要求"用中文回答",或使用中文能力更强的模型(DeepSeek/Qwen/GLM)。计费问题#
Q:一次请求消耗多少 Token?
A:看响应中的 usage 字段。输入 + 输出的 Token 总数就是消耗量。Q:流式请求怎么统计 Token?
A:设置 stream_options: {"include_usage": true},最后一个 chunk 会包含 usage。非流式请求默认返回 usage。Q:计费和 OpenAI 官方一样吗?
A:计费逻辑相同(按 Token),但倍率不同,POLOAPI 的国产模型更便宜。具体倍率见后台配置。功能问题#
Q:支持 Function Calling 吗?
A:支持。DeepSeek / GPT / Claude 等模型都支持,用法和 OpenAI 完全一致。Q:支持图片输入(Vision)吗?
A:支持。用 gpt-4o / claude-sonnet-4 等多模态模型,在 content 中传图片 URL 或 Base64。详见多模态调用指南。Q:支持 JSON 输出吗?
A:支持。设置 response_format: {"type": "json_object"}。详见JSON Mode 指南。Q:可以微调模型吗?
A:暂不支持。可以直接使用平台提供的预训练模型,通过 prompt 工程和 few-shot 达到定制效果。Q:视频生成要等多久?
A:通常 30 秒到数分钟,取决于模型和视频长度。详见异步任务说明。部署问题#
Q:跨域(CORS)怎么配置?
A:如果前端直接调 API 会遇到跨域问题。建议走后端代理,或联系管理员配置 CORS 白名单。Q:内网能调 API 吗?
A:POLOAPI 部署在公网,内网需要能访问外网。如果完全隔离,需要私有化部署。Q:支持私有化部署吗?
A:联系商务,支持私有化部署到客户机房。Q:怎么查看 API 调用日志?
A:管理后台 → 日志页面,可按 Key / 模型 / 时间筛选。