Meta 推出开源大模型 Llama 3,性能直逼 GPT-4
智者2024年4月20日消息,昨日美国科技巨头 Meta 推出了 Llama 3,号称“有史以来最强大的开源大模型”,外部开发者可直接免费使用。
在外界看来,Meta现在推出Llama 3,是为了追赶行业领导者OpenAI。但Meta首席执行官扎克伯格向外媒表示,“我们的目标不是与开源模型竞争,而是要超过所有人,打造最领先的人工智能。”
性能最好开源模型正是冲GPT-4来的?
很显然,Meta此次推出Llama3,正是冲着GPT-4来的。
作为追赶努力的一部分,Meta一直在发布像Llama 3这样的模型供开发人员免费商业使用,因为强大的免费模型的成功可能会阻碍竞争对手从其专有技术中赚取收入的计划。
扎克伯格表示,由于预训练和指令微调,Llama 3相比Llama 2有了极大的改进。
其主要亮点大都集中于:模型架构、预训练数据、预训练规模、指令微调。
如相较Llama 2,Llama3的训练集规模扩大了7倍、代码数据量增加了4倍,训练效率提升了大约3倍。
简单来说,Llama3目前有两个版本:8B版本和70B版本。
按 Meta官方的说法,这两个版本是目前同体量下,性能最好的开源模型。近期也将登陆主要的云供应商。
其中,70B版本具备超4000亿参数,将直接对标GPT-4;而8B版本在某些测试集上,性能比上一个版本的Llama 2 70B 还要强。
此外,8B 参数评测结果碾压 Gemma-7B、Mistral-7B 版本;而 Llama 3 70B 版本评测结果同样也在诸多成绩上超过了 Gemini 1.5 Pro 和 Claude 3 Sonnet。
从AI领域大佬们的反馈来看,Llama 3此次表现确实不同寻常。
AI三巨头之一的杨立昆(Yann LeCun) 专门为 Llama 3 发了一个帖子,马斯克则现身该评论区,留下一句“Not bad”。
人工智能和机器学习领域国际上最权威的学者之一、AI开源倡导者吴恩达则表示:“Llama 3的发布是自己这辈子收到过的最好的礼物,谢谢你Meta!”
正式版Llama 3或将于7月发布
在未来几个月内,Meta 或会推出更多版本。
英伟达高级科学家 Jim Fan 认为,之后可能会发布的 Llama 3-400B 以上版本,这或将成为某种“分水岭”,开源社区可能即将能用上 GPT-4 级别的模型。
Meta也在官方博客中明确指出,未来几个月内将推出的Llama3正式版本将具备“多模态”特性,即同时驾驭文本与图像生成。
但有知情人士透露,研究人员还未对Llama3进行细致的微调工作,所以尚未决定Llama 3是否将是多模态模型。
微调是模型开发过程中至关重要的一步,通过向现有模型注入额外的数据,使其能够习得新的知识或适应特定任务需求。通常情况下,参数量更大的模型能够产生更高质量的输出,而较小的模型则以快速响应见长。
如果说的再详细点,Meta 还计划推出新功能、更长的上下文窗口、额外的模型尺寸和增强的性能,并且将分享 Llama 3 的研究论文。
有消息称,正式版的Llama 3 将会在今年7月推出。
扎克伯格绑定谷歌,抗衡OpenAI和微软
扎克伯格在本月初,还向投资人表示,今年的主要关注领域包括推出Llama 3和“扩大Meta AI助手的实用性”。
所以,除了发布Llama 3,Meta还宣布与Alphabet旗下的谷歌达成一项新的战略合作伙伴关系。
此次合作,将使Meta的AI助手在回答用户问题时,可以实时融入来自谷歌搜索的权威结果,这也是对现有与微软必应合作的有效补充。随后,Meta AI助手正在扩展到美国以外的十多个市场,包括澳大利亚、加拿大、新加坡、尼日利亚和巴基斯坦。
扎克伯格周四在发布会上称,Meta AI是“你可以自由使用的最智能的人工智能助手”。他表示,最大版本的Llama 3目前正在用4000亿个参数进行训练,在MMLU(大规模多任务语言理解)测试中得分为85分。他表示,推出的两个较小版本现在分别有80亿个参数和700亿个参数,后者MMLU的得分为82分。
目前,Meta已将Llama 3模型集成到 Meta AI 中,官方认为这是世界上领先的 AI 助手。网页版已同步上线:meta.ai,用户登录后即可保存与 Meta AI 的对话记录。
据介绍,用户可以在 Facebook、Instagram、WhatsApp 和 Messenger 上使用 Meta AI 来完成任务、学习、创造。
开闭源之争再加剧,周鸿祎回怼李彦宏
开源和闭源之争,渐渐演变成一场宗教般的信仰之争,很难有人保持中立。
不久前,在百度AI开发者大会上,百度创始人、董事长兼首席执行官李彦宏称,“以前说开源便宜,其实在大模型领域,开源是最贵的。所以开源模型会越来越落后。”
此前,李彦宏在内部讲话时也提到,开源模型很难实现众人拾柴火焰高;同等能力下,闭源在成本上反而更有优势;闭源会持续领先,而非一时领先;闭源才有真商业模式,能赚到钱才能聚集人才和算力。
对此,360集团创始人周鸿祎在第二十七届哈佛中国论坛上,疑似回怼李彦宏:
“我一直相信开源的力量,至于网上有些名人胡说八道,大家也别被他们忽悠,说开源不如闭源好。”
“一句话,今天没有开源就没有Linux,没有Linux就没有互联网,就连说这话的公司自己都借助了开源的力量才成长到今天。”
“源社区聚集的工程师和科学家的数量是闭源的数百倍。所以,今年开源只做了一年就已经超过了GPT-3.5的能力。未来一两年内,开源的力量很有可能会达到或者超过闭源的水平。”
周鸿祎还举例说,“前两天百度的李彦宏说他们的大模型超过了GPT-4,然后王小川不相信,就出来怼李彦宏。其实你仔细听听李彦宏说的是有道理的,他是说在写古诗方面,百度超过了GPT-4”。
近期,原搜狗创始人、现百川智能创始人王小川,在接受媒体采访时犀利吐槽:李彦宏很魔幻主义,去年2月就喊出比OpenAI只差两个月,已经够有幻觉了。
在国外,AI三巨头之一的杨立昆Yann LeCun认为,科学论文、代码的自由交换以及AI训练模型的公开共享使美国在科学技术领域保持领先地位。这个理念并非新颖,很久以前就有了。
开源实现了对访问的民主化。它让更多的人和企业有能力利用最先进的技术,并弥补潜在的弱点。这也有助于促进民主价值观和制度,减少社会差距并改善竞争。
而来自麻省理工学院和剑桥大学的科学家们在一篇论文中提到,发现开源大模型的确可能存在被不良行为者操纵的风险。Anthropic 公司研究人员也曾发表论文警告称,AI中毒可能导致开源大模型变成潜伏的间谍。