本帖最後由 javacomhk 於 2025-3-18 02:37 編輯
截至2025年3月,文心一言API的Token计费政策如下:
一、计费模式与Token定义
1. 按Token双向计费
收费同时计算API请求的输入Token(用户发送的文本)和输出Token(模型生成的文本),每1,000个Token为一个计费单位
2. Token换算规则
• 中文:1个汉字 ≈ 1.5-2 Tokens(因分词规则而异)
• 英文:1个单词 ≈ 1-3 Tokens(视复杂度而定)
• 标点/符号:每个独立符号计为1 Token
二、具体收费标准
注:
• 免费版(如ERNIE Speed)适用于轻量级需求,但功能限制较多(如不支持长上下文);
• 企业用户可申请阶梯折扣(用量越大单价越低)。
三、免费额度与计费示例
1. 新用户优惠
• 首次注册赠送50万Tokens(可用于任意付费模型);
• 每月持续赠送10万Tokens(仅限ERNIE Speed使用)。
2. 计费示例
若调用ERNIE-Bot-4生成一篇1,000字(约2,000 Tokens输入)的回答(约800 Tokens输出):
• 输入费用:2,000/1,000,000 × ¥8.0 = ¥0.016
• 输出费用:800/1,000,000 × ¥9.5 = ¥0.0076
• 总费用:约¥0.0236(人民币2分钱)27
四、与其他模型的横向对比
注:
• 百度ERNIE-Bot系列定价高于竞品,但功能更完整(如长上下文支持);
• 阿里云(https://baike.baidu.com/item/%E9%98%BF%E9%87%8C%E4%BA%91/297128)因降价策略具备显著价格优势,但需注意其模型能力差异。
五、注意事项
1. 上下文长度影响成本
长上下文(如128K)会显著增加输入Tokens消耗,建议根据需求选择合适版本78;
2. 预付费模式
需先在百度智能云账户充值,支持绑定国际信用卡或银行转账;
3. 用量监控
可通过控制台设置月度预算警报,避免超额消费。
如需最新价格或企业级合作方案,建议直接访问百度智能云官网(https://cloud.baidu.com)查询
截至2025年3月17日,根据百度最新政策,文心一言API对个人用户的收费政策及免费版ERNIE Speed的限制如下:
一、API个人用户费用
1. 全面免费政策
自2025年4月1日起,文心一言所有版本(包括ERNIE-Bot 4.0、4.0 Turbo等)的API接口向个人用户完全免费开放,无需支付任何费用即可调用。
• 适用范围:包括代码生成、多模态交互、超长文档处理等全部功能;
• 调用方式:通过百度智能云平台申请API Key,绑定开发者账号后即可使用。
二、免费版ERNIE Speed的限制
尽管所有版本已免费,ERNIE Speed作为轻量级模型仍存在以下功能性限制:
1. 上下文长度限制
• 最大支持8K Tokens的上下文输入,无法处理超长文本(如书籍、复杂代码库);
• 付费版ERNIE-Bot 4.0支持128K Tokens的上下文。
2. 多模态能力限制
• 仅支持基础文本生成和简单问答,不支持图像生成、语音交互、视频解析等高级多模态功能。
3. 响应速度与并发限制
• 优先级较低,高峰期可能出现延迟增加(平均响应时间3-5秒,付费版为1-3秒);
• 个人用户并发请求限制为5次/秒,超出后需排队处理。
4. 企业级功能禁用
• 不支持定制化模型训练、私有化部署、数据隔离等企业服务。
三、其他注意事项
• 开发者认证:需完成实名认证以获取API调用权限,境外用户需提供护照或身份证件;
• 用量监控:免费服务虽无硬性限额,但百度保留对异常高频调用(如日均超100万次)的限制权利;
• 技术支持:免费用户仅提供社区论坛支持,付费版可享工单优先处理。
如需使用无限制的高阶功能,建议升级至ERNIE-Bot 4.0 Turbo(仍为免费),详情可参考百度智能云官方文档(https://cloud.baidu.com) |