零一万物开源全新Yi-9B模型:代码与数学能力出众,超越多个同类模型
【HowToTech科技】3月7日消息,近日,“零一万物
01AI”官方公众号发布消息,宣布其已成功开源名为Yi-9B的全新模型。该模型被誉为Yi系列中的“理科状元”,在代码和数学能力上展现出卓越实力,成为目前Yi系列模型中的佼佼者。
据悉,Yi-9B模型的实际参数达到了8.8B,默认上下文长度更是高达4K
tokens。这款模型在Yi-6B的基础上进行了进一步的训练和优化,使用了0.8T tokens的数据进行精细调整,训练数据截至2023年6月。
在综合能力方面,Yi-9B模型表现出色,超越了众多同尺寸的开源模型,如DeepSeek-Coder、DeepSeek-Math、Mistral-7B、SOLAR-10.7B和Gemma-7B等。在代码能力上,Yi-9B仅次于DeepSeek-Coder-7B,但超越了Yi-34B、SOLAR-10.7B、Mistral-7B和Gemma-7B等众多竞争对手。同时,在数学能力方面,Yi-9B也展现出强大的实力,仅次于DeepSeek-Math-7B,超越了SOLAR-10.7B、Mistral-7B和Gemma-7B等模型。
Yi-9B在常识和推理能力方面也表现出不俗的水平,与Mistral-7B、SOLAR-10.7B和Gemma-7B等模型不相上下。此外,官方还特别强调,无论是Yi-9B(BF
16)还是其量化版Yi-9B(Int8),都能够在消费级显卡上实现轻松部署,大大降低了使用成本,对开发者来说非常友好。
据HowToTech科技了解,零一万物公司由李开复创新工场董事长兼CEO带队创办,此前已经成功推出了Yi-34B和Yi-6B两个开源大模型。该公司表示,他们对学术研究完全开放,并同步开放免费商用申请,以推动人工智能技术的广泛应用和发展。
延伸阅读:
OpenAI 测试长输出版 GPT-4o:单次输出达64K tokens
【HowToTech科技】8月1日消息,OpenAI在7月29日透露,他们正在对一款名为GPT-4o Long Outp...
ISC.AI2024数字安全峰会:360、华为、微软等共话安全+AI新挑战
7月31日,ISC.AI 2024数字安全峰会在北京国家会中心顺利召开。峰会以“打造安全大模型,引领安全行业革命”为主题...
ISC.AI2024开幕 周鸿祎发布国内首个免费安全大模型
“把大模型拉下神坛就要把免费贯彻到底,今天我在行业里第一个宣布安全大模型免费。”7月31日,ISC.AI2024第十二届...
实时对话更自然,OpenAI 向部分付费订阅用户开放 GPT-4o 语音模式
【HowToTech科技】7月31日消息,OpenAI于当地时间30日宣布,即日起GPT-4o的语音模式(注:Alpha...