就在刚刚,Anthropic正式宣布,Claude 3.5 Haiku已经可以通过API访问。

巧的是,几乎同一时间,xAI那边也官宣,Grok API正式开启公测。

Claude 3.5 Haiku正式开放API
现在,Claude 3.5 Haiku已经在Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI上全线就位。
Anthropic的开发者关系运营负责人Alex Albert发帖称:“该模型还更新了截至2024年7月的知识——是所有Claude模型中最新的。” 这意味着,它已经带着最新的知识储备上场了。

从性能角度来看,Claude 3.5 Haiku的表现确实不俗,已经在向Sonnet看齐。

在编程和袋里任务上,它的表现也超越了除新款3.5 Sonnet之外的所有此前Claude模型。

SWE-bench Verified测试的结果,恰好印证了它在解决实际软件问题上的能力。
AI公司iGent的CEO评价道:“Claude 3.5 Haiku展现了令人印象深刻的推理和代码生成能力,包括展示强大的多轮代码优化功能,使与代码相关的错误减少了60%。它和其他体积更大的模型处于同一水平。”

基于这些特性,Claude 3.5 Haiku非常适合面向用户的产品、专业化的子袋里任务,以及从大量数据(如购买历史、定价或库存记录)中生成个性化体验。
Anthropic也给出了一些典型的使用场景:
1. 代码补全:提供快速、准确的代码建议和补全,加速开发工作流。
2. 交互式聊天机器人:凭借增强的对话能力和快速响应,非常适合支持大规模互动,这对客户服务、电商和教育平台尤其有价值。
3. 数据提取和标注:高效处理和分类信息,在快速数据提取和自动化标注任务中表现出色,对金融、医疗和研究机构特别实用。
4. 实时内容审核:通过改进的推理和内容理解能力,提供可靠的即时内容审核,对社交平台、在线社区和媒体组织很有价值。
不过,性能提升的代价也很直接——Haiku的价格直接翻了4倍。现在的定价是每百万输入tokens 1美元,每百万输出tokens 5美元。


网友:能力不咋行,涨价第一名
这个价格一出,网友们的吐槽就涌上来了。
“Jimmy Apples”感慨道:“如今,Anthropic的光芒正在褪去。” 比起隔壁的4o-mini,3.5 Haiku在很多基准测试上的表现更差,但价格却更贵。

网友“John”专门做了一张Claude 3.5 Haiku和Gemini 1.5 Flash的性能/价格对比图,结论很直观:3.5 Haiku要花几十倍的钱,但换来的性能提升却微乎其微。


网友“elvis”甚至直接画了柱状图,直观地展示Haiku夸张的涨价幅度。

同时,他还对比了Claude 3.5 Haiku、GPT-4o Mini和Gemini 1.5 Flash在MATH Benchmark和GPQA Diamond Benchmark上的表现——结果显示,3.5 Haiku相比上一代价格翻了4倍,而那些表现基本持平甚至更好的同类模型,价格却“断崖式”地便宜。


当然,网络中也不乏惊喜的欢呼声。

Grok API开启公测
与此同时,马斯克的xAI也带来了新消息:Grok API正式开启公测。到2024年底,每月有25美金的免费额度,人人可参与。如果之前已经购买了预付费额度,比如50美元,那么在11月和12月,每月都能获得75美元(25+50)的免费额度。

模型性能
根据官方博客,此次xAI公开了一个全新的Grok模型,代号“grok-beta”,目前正处于开发的最后阶段。该模型上下文长度为128000 token,意味着它可以处理更长的文本输入,理解更复杂的上下文关系。


除了支持函数调用,它也支持系统提示词,让开发者能更灵活地控制模型行为。这意味着它可以与外部工具高效连接和交互,为各种复杂应用场景的实现提供了可能。
借此机会,xAI还透露,除了纯文本版本外,下周还将发布一个支持图像输入的多模态版本。以后,Grok不仅能读懂文字,也能“看懂”图片了。
兼容OpenAI和Anthropic API
值得留意的是,为了让开发者用得顺手,xAI的REST API完全兼容OpenAI和Anthropic的API,迁移起来非常方便。如果你正在使用OpenAI的Python SDK,只需要做两个简单的改动:
– 将base_url改为https://api.x.ai/v1
– 使用在console.x.ai创建的xAI API密钥
就这么简单,你的应用就能无缝切换到Grok了。
