【BOMG-002】完全独占！ Mカップ19才デビュー！ 100万人に1人の超乳ボディ！初めまして、MOMOです。 B106（M65） W58 H85 / BomBom Cherry</a>2015-01-26ボンボンチェリー/妄想族&$BOMBO187分钟 Llama 3.1提前泄密，将GPT-4o踹下宝座？更快，价钱低廉10倍

发布日期：2024-07-24 17:57 点击次数：101

文｜常敏潇袁滢靓【BOMG-002】完全独占！ Mカップ19才デビュー！ 100万人に1人の超乳ボディ！初めまして、MOMOです。 B106（M65） W58 H85 / BomBom Cherry2015-01-26ボンボンチェリー/妄想族&$BOMBO187分钟

裁剪｜邓咏仪

如果说成为开源模子天花板，是Llama大模子的运，那“惨遭泄露”，便是Llama要渡的劫。

2023年3月，Llama 2就因提前泄露，Meta不得不以开源的姿首发布模子。

如今，历史再次重演。

太平洋时刻7月12日，别称Meta职工流露，Meta计算于当地时刻2024年7月23日发布迄今已毕Llama最大的参数领域版块：Llama 3.1 405B。他流露，405B将会是Llama系列中首个多模态模子。

但是，就在太平洋时刻7月22日，预定发布时刻的前一日，Llama3.1的模子和基准测试效果就在Reddit等本领社区上泄露，Llama 3.1的磁力承接（用于下载文档的活动）仍是在HuggingFace等社区中流传。

从泄露的效果中看，Llama 3.1的性能，足以比好意思OpenAI的GPT-4o！

有AI博主盛赞，Llama 3.1的发布，将又是扭转AI界荣幸的一天：

△开头：X

精美套图

泄露的基准测试效果自大，Llama 3.1共有8B、70B、405B三种领域。参数目最小的70B模子，很多方面的性能也与GPT-4o不相高低。

△上图为Llama 3.1 各版块与 OpenAI GPT-4o、Llama 3 8B/70B 的对比，其中，领域居中的70B版块，也在诸多方面卓绝了 GPT-4o。图源：X用户@mattshumer_

有网友指出，如果依据这个基准，Llama 3.1 405B ≈ GPT-4o，Llama 3.1 70B 则将成为能打败了OpenAI的首个轻量级模子、GPT-4o mini。

△图源：X用户@corbtt

不外，不少仍是下载模子“尝鲜”的网友发现，泄露版的Llama 3.1 405B，系数文献大小果然约有820GB，所需内存是保留好意思满精度的Llama 2（约280GB）的近3倍。

这意味着，若非家里有矿，买得起实足多GPU，个东说念主成立者很难用我方的电脑把Llama 3.1跑起来。部分网友猜测，Llama 3.1并非面向个东说念主，而是面向机构和企业。

还未官宣的Llama 3.1也被泼了盆冷水。不少网友倒苦水：Llama 3.1对GPU的条目太高了，不如近邻OpenAI家的GPT-4o mini物好意思价廉。

△X上的网友挑剔。图源：X用户@_Talesh

功能迭代，见地优化，计较资源减少

笔据泄露的模子信息，Llama 3.1相较于2024年4月19日发布Llama 3，在功能上有了更多的迭代，包括更长的高低文窗口、多谈话输入和输出以及成立东说念主员与第三方用具的可能集成。

数据实践：Llama 3.1使用了公开开头的 15T+ tokens进行实践，微调数据包括公开可用的指示调优数据集（与 Llama-3 不同！）以及卓绝 2500 万个合成生成的示例。

多谈话对话：Llama 3.1撑捏8种谈话：英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语。天然很缺憾莫得汉文，但成立东说念主员不错针对 8 种撑捏谈话之外的谈话对 Llama 3.1 模子进行微调。

高低文窗口：每个版块的高低文长度从8k推广至128k，大约终点于模子一次大致记取、皆集和惩办9.6万字，险些是一整本原版《哈利·波特》。

很多网友蠕蠕而动，让Llama 3.1与模子“前辈们”一同竞技，发现不仅是见地有了显赫擢升，色情小游戏计较资源也省俭不少。

基于网友的测试，与Llama 3比拟，Llama 3.1的智商有显赫擢升。其中human_eval和truthfulqa_mc1两项智商向上赫然，意味着生成编程代码的智商更强、生成问题谜底时更具简直性。

同期，Llama 3的instruct（指示）模子相较于base（基座）模子，在教唆学习、语境学习、高效参数微调等见地擢升赫然。

这是合理的，因为base模子频繁未经特定任务微调，而instruct模子进程挑升实践后，能遵从指示或完成特定任务。频繁，instruct模子的见地推崇更出色。

这让东说念主愈加期待Llama3.1的肃肃发布。当今泄露的Llama3.1模子测试，效果只是针对base模子，而instruct模子推崇可能会更佳！

△图源：X用户@thenameless7741

令东说念主讶异的是，基准测试效果中，Llama 3.1 70B模子打平以致打败 GPT-4o，Llama 3.1 8B模子则与Llama 3 70B模子性能接近。有网友猜测，这可能接管了模子蒸馏本领，即8B和70B的模子是由405B最大领域的模子简化得出，让大模子变“小”。

模子蒸馏本领不错看作学生向赤诚学习。大而强的模子（赤诚模子）是赤诚，较小且简便的模子（学生模子）是学生。学生模子通过“师法”赤诚模子来学习，使输出尽可能接近赤诚模子的输出，从而学到同样的学问和智商。

进程蒸馏实践后的学生模子，不错减少模子大小和计较资源需求，同期又能保捏较高的性能推崇和终点的精度。

△图源：Reddit

不是谁都跑得动，但推理价钱很合算

Llama 3.1到底会不会遂愿开源，如故个未知数。但即便开源，思要用得起Llama 3.1，家里仍然得有矿。

思要跑得动Llama 3.1，最基础的初学券，便是实足的GPU。

泄露文献自大，Llama 3.1 405B在H100-80GB类型硬件上的实践时刻为30.84M GPU小时。这意味着，假定每小时只用一张H100-80GB，启动Llama 3.1 405B就要花30.84M小时——等模子跑起来，要过3500年！

△图源：Reddit

如果思要专有化部署，企业要思在一个月内顺利启动Llama 3.1 405B，就要储备起码43000块H100-80GB。按照4万好意思金的H100单价算，使用Llama 3.1 405B的算力入场券，就高达17亿好意思金，折合东说念主民币125亿元。

不外好音书是，Llama 3.1的推理资本，可能会更低廉。

据Artificial Analysis计算，模糊1百万Tokens所需的资本，Llama 3.1 405B将比质料同样的前沿模子（GPT-4o 和 Claude 3.5 Sonnet）低廉，更具性价比。

△图源：X用户@ArtificialAnlys

除此之外，有网友通过源文献代码猜测，Llama 3.1 405B可能会成为会员家具，用户使用时需要付费。不外，简直情况怎么，还需恭候官方发布。

△图源：X用户@testingcatalog

（36氪作家周鑫雨对本文亦有孝敬）

接待疏通【BOMG-002】完全独占！ Mカップ19才デビュー！ 100万人に1人の超乳ボディ！初めまして、MOMOです。 B106（M65） W58 H85 / BomBom Cherry2015-01-26ボンボンチェリー/妄想族&$BOMBO187分钟

接待疏通