常见问题

Q：Nexhina 和 OpenAI 官方有什么区别？
A：Nexhina 是兼容 OpenAI 格式的网关，多了国产模型支持（DeepSeek/Qwen/GLM等），价格更灵活。接口格式完全兼容，OpenAI SDK 直接用。

Q：支持哪些编程语言？
A：任何支持 HTTP 的语言都能调。Python 和 Node.js 有官方 SDK 最方便，其他语言（Go/Java/PHP/Rust）用 HTTP 客户端直接请求即可。

Q：可以免费试用吗？
A：联系管理员获取测试 Key，一般会有初始额度。

Q：返回 context_length_exceeded 怎么办？
A：输入太长了。精简 messages 内容，或换上下文更长的模型（如 gpt-4.1 支持 1M）。

Q：返回 model_not_found 怎么办？
A：model 参数写错了。调用 GET /v1/models 查看可用模型列表，注意大小写。

Q：流式输出中断了怎么办？
A：网络问题导致 SSE 断连，无法续传，需要重新发起请求。建议客户端做拼接逻辑，断流后重新请求。

Q：为什么回复内容被截断？
A：可能是 max_tokens 设太小，或模型输出达到上限。检查 finish_reason，如果是 length 说明被截断了，加大 max_tokens。

Q：中文回复质量不好怎么办？
A：试试在 system 消息中明确要求"用中文回答"，或使用中文能力更强的模型（DeepSeek/Qwen/GLM）。

Q：一次请求消耗多少 Token？
A：看响应中的 usage 字段。输入 + 输出的 Token 总数就是消耗量。

Q：流式请求怎么统计 Token？
A：设置 stream_options: {"include_usage": true}，最后一个 chunk 会包含 usage。非流式请求默认返回 usage。

Q：计费和 OpenAI 官方一样吗？
A：计费逻辑相同（按 Token），但倍率不同，POLOAPI 的国产模型更便宜。具体倍率见后台配置。

Q：支持 Function Calling 吗？
A：支持。DeepSeek / GPT / Claude 等模型都支持，用法和 OpenAI 完全一致。

Q：支持图片输入（Vision）吗？
A：支持。用 gpt-4o / claude-sonnet-4 等多模态模型，在 content 中传图片 URL 或 Base64。详见多模态调用指南。

Q：支持 JSON 输出吗？
A：支持。设置 response_format: {"type": "json_object"}。详见JSON Mode 指南。

Q：可以微调模型吗？
A：暂不支持。可以直接使用平台提供的预训练模型，通过 prompt 工程和 few-shot 达到定制效果。

Q：视频生成要等多久？
A：通常 30 秒到数分钟，取决于模型和视频长度。详见异步任务说明。

Q：跨域（CORS）怎么配置？
A：如果前端直接调 API 会遇到跨域问题。建议走后端代理，或联系管理员配置 CORS 白名单。

Q：内网能调 API 吗？
A：POLOAPI 部署在公网，内网需要能访问外网。如果完全隔离，需要私有化部署。

Q：支持私有化部署吗？
A：联系商务，支持私有化部署到客户机房。

Q：怎么查看 API 调用日志？
A：管理后台 → 日志页面，可按 Key / 模型 / 时间筛选。