AI公司MosaicML推出70亿参数模型MPT-7B-8,号称“一次处
,AI 创业公司 MosaicML 近日发布了其 70 亿参数模型 MPT-7B-8K,据悉,该模型一次可以处理 8000 字文本,相当擅长处理长文重点摘要和问答,还能在 MosaicML 平台上根据特定任务,进一步微调相关配置。
据悉,系列模型采用了 150 万个 Token,并以 256 块 H100 GPU 花 3 天完成模型训练而成。MosaicML 本次发布了 3 个版本模型,包括 MPT-7B-8k、MPT-7B-8k-Instruct 和 MPT-7B-8k-Chat。
其中,第一个版本 MPT-7B-8k、是以 Transformer 解码器为基础,并以 FlashAttention 和 FasterTransformer 机制来加速训练与推论,能一次处理 8000 字文本,MosaicML 公司表示,该模型开源、允许商用。
第二个版本 MPT-7B-8k-Instruct 是以第一个版本 MPT-7B-8k 微调而成,MosaicML 公司表示,MPT-7B-8k-Instruct 模型可处理长篇指令,特别注重于生成“摘要和问答”,该模型一样开源且可商用。
第三个版本 MPT-7B-8k-Chat 则是机器人对话式的 AI 模型,MosaicML 公司宣称,该模型额外多用了 15 亿个聊天数据 Token,在第一版模型 MPT-7B-8k 之上继续训练而成,该模型开源,但不允许商用。
IT之家此前报道,MosaicML 公司也推出了一款号称训练成本仅为竞品零头的 MPT-30B 开源模型,该公司日前已将所有开源模型发布于 Huggingface 平台,感兴趣的小伙伴们可以前往进行相关了解,还可以在本地硬件上使用自己的数据,在下载后,对模型进行各种微调。
广告声明:文内含有的对外跳转链接,用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。
猜您喜欢
-
11-13
-
10-12
-
10-08
-
10-08
-
10-08
-
10-08
-
10-08
-
10-08
-
10-08
-
10-08
推荐阅读
-
电子行业年报综述:行业虽面临压力整体仍保持相
电子年度报告摘要2021年,电子行业尽管受到全球疫情和行业周期的干扰,但仍保持稳定增长态势。2021年,申万电子行业整体...更多
2022-05-16 13:21:00
-
潮安登塘举办乡村振兴电商特训班,培养农特产品
“我以前是刷短视频的。不知道别人的视频怎么拍的这么好?通过老师的讲解,我终于领悟了,受益匪浅!”5月14日至15日,潮州...更多
2022-05-16 13:18:00
-
2022前四月住宅新开工面积同比下降28.4
北京商报今日讯——5月16日,国家统计局发布2022年1-4月全国房地产开发投资数据。1-4月份,房地产开发企业房屋施工...更多
2022-05-16 12:51:00
-
西北地区绿色电力交易实践与思考
绿色电力交易是指以绿色电力产品为标的物的中长期电力交易,是中长期电力市场体系中全新的交易品种。绿色电力交易的目的是将新能...更多
2022-05-16 12:39:00
-
华为鲁勇:打造数字经济新动能让更多的人从数字
在2022年世界电信和信息社会日到来之际,我谨代表华为向广大客户、产业链合作伙伴和各界朋友致以诚挚的问候,期待与您携手共...更多
2022-05-16 11:46:00
-
GSMA:中国大陆5G渗透率36.82%位居
近日,GSMA发布了最新的统计信息。截至2022年第一季度,在全球5G渗透率排名中,南韩以44.92%位居第一,其次是中...更多
2022-05-16 11:22:00
-
看了这款潮野SUV哈弗大狗,我直接退掉了CR
费用在心里。随着国家自主品牌趋势的觉醒,对应这个细分市场的产品也越来越丰富。我们不再需要在少数合资品牌中挑三拣四,可以进...更多
2022-05-16 11:20:00
-
统计局:前4月全国固定资产投资153544亿
据国家统计局网站消息,1-4月,全国固定资产投资153544亿元,同比增长6.8%。其中,民间固定资产投资86872亿元...更多
2022-05-16 11:20:00
-
今日必看
- 浏览排行
- 热门精选