当前位置:首页 > 资讯中心 > 天齐网 > 正文

阿里云发布开源模型Qwen2,宣称性能超美国最强开源模型Llama3-70B

2024-06-07 11:01 陶然歌词网

  新浪科技讯 6月7日上午消息,阿里云更新技术博客:重磅发布全球性能最强的开源模型Qwen2-72B。据介绍,该模型性能超过美国最强的开源模型Llama3-70B,也超过文心4.0、豆包pro、混元pro等众多中国闭源大模型。所有人均可在魔搭社区和Hugging Face免费下载通义千问最新开源模型。

  相比2月推出的通义千问Qwen1.5,Qwen2实现了整体性能提升,代码、数学、推理、指令遵循、多语言理解等能力大幅提升。在MMLU、GPQA、HumanEval、GSM8K、BBH、MT-Bench、Arena Hard、LiveCodeBench等国际权威测评中,Qwen2-72B斩获十几项世界冠军,超过美国的Llama3。

  据介绍,Qwen2系列包含5个尺寸的预训练和指令微调模型,Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B,其中Qwen2-57B-A14B为混合专家模型(MoE)。Qwen2所有尺寸模型都使用了GQA(分组查询注意力)机制,以便让用户体验到GQA带来的推理加速和显存占用降低的优势。

  据悉,通义千问Qwen系列模型正在全球爆火,总下载量一个月内翻了一倍,已突破1600万次。全球开源社区已经出现了超过1500款基于Qwen二次开发的模型。Qwen系列的72B、110B模型多次登顶HuggingFace 的Open LLM Leaderboard开源模型榜单。(文猛)

上一篇:电影咖“下凡”电视圈 为何频频遭遇“滑铁卢”?
下一篇:2024年7月中国厨余垃圾处理器市场总结
  • 网友偶遇文章带两女儿出游,全程未见马伊琍身影

    网友偶遇文章带两女儿出游,全程未见马伊琍身影

    9月30日报道9月29日,有网友晒视频称在上海明珠电视台偶遇了文章,据悉,文章虽然在忙着拍戏,但是每周末都会回上海陪伴女儿,这次更是带两个女儿一同出来游玩。视频中,文章身穿白色T恤搭配短裤造型简单,大女儿爱马身穿长袖外套搭配白…
    10-01
  • 历史性一刻!2024年Mini LED电视首次超越OLED电视

    历史性一刻!2024年Mini LED电视首次超越OLED电视

    快科技4月8日消息,洛图科技(RUNTO)发布了《高端电视市场中OLED和MiniLED的竞争态势》的报告。报告预测,2024年MiniLED电视首次超越OLED电视。在一众高端显示技术中,MiniLED技术脱颖而出,出货量稳步增长,2023年MiniLED电视出货量达…
    04-08
  • Mnet称将积极赔偿PD造假案受害者 不公布具体金额

    Mnet称将积极赔偿PD造假案受害者 不公布具体金额

    韩国Mnet电视台在《Produce101》系列造假案受害练习生名单公布后表明赔偿计划,称将积极赔偿因伪造投票而遭受损失的练习生。Mnet电视台相关负责人表示,津渊美智子Mnet电视台自从确认《Produce101》系列造假事件后就主动确认哪些练习生因…
    11-19
  • 岳云鹏担心拖累票房 《哪吒》火爆怕新片难生存

    岳云鹏担心拖累票房 《哪吒》火爆怕新片难生存

    文/图羊城晚报记者王莉喜剧电影《鼠胆英雄》近日在北京举行首映仪式,岳云鹏和佟丽娅的水下吻戏桥段曝光,惹得王迅、孙越、刘仪伟等一众观影嘉宾直呼羡慕,铃村爱里佟丽娅则透露这场戏拍得非常不容易:“我跟小岳岳都不会游泳,确实会觉…
    08-02
  • 医护粉丝表白徐姑姑想要签名照 罗晋:现在就安排

    医护粉丝表白徐姑姑想要签名照 罗晋:现在就安排

    3月10日晚,洛浦的简历一位援鄂医护人员在微博上晒出身穿防护服的工作照,并发文表白罗晋,称:“不想吃好吃的好喝的,逍遥兵王洛天最快新想追一下星。低落时像佛系的徐姑姑学习,逍遥兵王洛天最快新奥利给。很遗憾写上晋哥的名字的衣服…
    03-11