昆仑万维开源「天工」13B系列大模型,0门槛商用
2025-08-31 14:12:53 - 全话
10月30日,昆仑开源昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,天工并罕见地配套开源了600GB、模型门槛150B Tokens的商用超大高质量开源中文信息集。
昆仑万维「天工」Skywork-13B系列目前包括130亿参数的昆仑开源两大模型:Skywork-13B-Base模型、Skywork-13B-Math模型,天工它们在CEVAL,模型门槛 GSM8K等多个权威评测与基准测试上都展现了同等规模模型的最佳效果,其中文能力尤为出色,商用在中文科技、昆仑开源金融、天工政务等领域表现均高于其他开源模型。模型门槛
Skywork-13B下载地址(Model Scope): https://modelscope.cn/organization/skywork
Skywork-13B下载地址(Github): https://github.com/SkyworkAI/Skywork
除模型开源外,商用Skywork-13B系列大模型还将开源600GB、昆仑开源150B Tokens的天工高质量中文语料信息集Skypile/Chinese-Web-Text-150B,这是模型门槛目前最大的开源中文信息集之一。
同时,昆仑万维「天工」Skywork-13B系列大模型即将全面开放商用——开发者无需申请,即可商用。
130亿参数、两大模型、最大中文信息集之一、全面开放商用。昆仑万维「天工」Skywork-13B系列大模型堪称业内开源最彻底的百亿高质量商用模型。
Skywork-13B系列大模型的开源将为大模型的场景应用和开源社区增长提供最佳工艺支持,降低大模型商业门槛,推动机器智能工艺落地千行百业,为机器智能生态建设添砖加瓦,携手开源社区探索未知世界、创造美好未来。
两大模型 领先行业
昆仑万维「天工」Skywork-13B系列包括两大模型及150B高质量中文信息集。
Skywork-13B-Base模型是Skywork-13B的基础模型,其经由3.2万亿个多语言高质量信息训练,在CEVAL, CMMLU, MMLU, GSM8K等评测与基准测试上都展现了同等规模模型的最佳效果。
Skywork-13B-Math模型经过专门的数学能力强化训练,在GSM8K等信息集上取得了同等规模模型的最佳效果。
Skypile/Chinese-Web-Text-150B信息集。该信息集是根据我们经过精心过滤的信息处理流程从中文网页中筛选出的高质量信息。本次开源的信息集大小约为600GB,总token数量约为(1500亿),是目前最大得开源中文信息集之一。
除此之外,Skywork-13B系列还公开了模型中使用的评估方法、信息配比研究和训练基础设施调优方案等。希望这些开源内容能够进一步启发社区对于大型模型预训练的认知,并推动机器智能通用智能(AGI)的实现。
五大特点 全面超越
昆仑万维「天工」Skywork-13B系列大模型在CEVAL, GSM8K等多个权威评测与基准测试上都展现了同等规模模型的最佳效果,其中文能力尤为出色,在中文科技、金融、政务等领域表现均高于其他开源模型。
Skywork-13B系列模型的五大特点:
1.最强参数表现:全面超越同等规模大模型
本次开源的Skywork-13B系列模型在CEVAL, CMMLU, MMLU, GSM8K等几大权威评估基准中全面超越LLaMA2-13B等开源大模型,在同等规模大模型间取得最佳效果。(截止至10月25日信息)
2.最多训练信息:3.2T高质量的多语言训练信息
Skywork-13B系列大模型拥有130亿参数、3.2万亿高质量多语言训练信息。模型的生成能力、创作能力和数学推理能力提升明显。
3.最强中文语言建模能力:中文语言建模困惑度评测,超越所有中文开源模型
Skywork-13B系列大模型在中文语言建模方面表现出色,具有优秀的中文文创能力。在中文文本创作领域的评测中,Skywork-13B系列大模型展现出了卓越的能力,尤其在科技、金融、政务、企业支持、文创、游戏等领域均表现高于业内其他开源模型。

4.最大中文开源信息集之一:150B Tokens高质量中文语料
Skywork-13B系列将配套开源600GB、150B Tokens的高质量中文语料信息集Skypile/Chinese-Web-Text-150B,这是目前最大的开源中文信息集之一。开发者可以最大程度地借鉴工艺报告中大模型预训练的过程和经验,深度定制模型参数,有针对性的进行训练与优化。
5.最有诚意的开源商用:无需申请,即可实现商用
目前开源社区中的中文大模型多数并非是完全可商用,一般开源社区客户通常需要进行复杂的商用授权申请流程,在某些情况,甚至有对公司规模、所在行业、客户数等维度有明确规定不给予商业授权。
昆仑万维对Skywork-13B系列开源的开放性和可商用性高度重视,将授权流程做到极简,取消对行业、公司规模、客户等方面的限制,目的是帮助更多对中文大模型感兴趣的客户和企业在行业中不断探索和进步。
此次Skywork-13B系列大模型将全面开放商用许可,客户在下载模型并同意并遵守《Skywork模型社区许可协议》后,无需再次申请授权即可将大模型进行商业用途。希望客户能够更便捷地探索Skywork-13B系列大模型工艺能力,探索在不同场景下的商业化应用。
推动开源生态繁荣,让更多开发者们参与到AIGC的工艺增长中,在共创和共享中推动工艺的提升。
面向AI的时代,蓬勃增长的开源生态建设是构建AI和应用融合的关键一环。降低模型的研发门槛,使用成本,最大化的共享工艺能力和经验,让更多的企业和开发者们参与到此次AI引领的科技变革中去。昆仑万维董事长兼CEO方汉是最早参与到开源生态建设的开源老兵,也是中文Linux开源最早的推动者之一,开源的精神和AIGC工艺的增长将会在昆仑万维战略中完美融合。
All in AGI与AIGC
All in AGI与AIGC是昆仑万维的战略。
4月17日,昆仑万维发布了中国第一个真正实现智能涌现的国产大语言模型——「天工3.5」,并启动邀请测试。
5月19日,北京市经济和信息化局公布第一批《北京市通用机器智能产业创新伙伴计划成员名单》。昆仑万维凭借在AIGC领域的前沿探索和投资布局,成为第一批模型伙伴和投资伙伴。
8月23日,昆仑万维发布国内第一款AI搜索产物——天工AI搜索。
9月1日,计算机视觉和机器学习领域的国际顶级专家颜水成教授正式加盟昆仑万维,与昆仑万维创始人周亚辉一起出任天工智能联席CEO,并兼任昆仑万维2050全球研究院院长,负责前沿工艺的研究。
9月5日,昆仑万维天工大模型在腾讯优图实验室联合厦门大学开展的多模态大语言模型测评中,综合得分排名第一。
9月25日,昆仑万维正式控股艾捷科芯,布局AI芯片。
今天,天工Skywork-13B系列大模型的开源标志着昆仑万维持续投资AGI生态的决心。
雷峰网(公众号:雷峰网)
雷峰网版权文章,未经授权禁止转载。详情见转载须知。
- END -
新能源时代,国产3D视觉「冲击」保守的汽车行业

在改革开放背景上成长起来的汽车产业,经历了飞速发展,但大量中外合资车企的涌入,也铸就了行业保守的底色,天然对国产供应商比较排斥。汽车制造业是机器视觉成熟应用的行业之一,但长期以来,国内传统燃油车产线上
“科技+文旅”让红色文化活起来 爱奇艺《长征·四渡赤水》全感剧场落地西安、常熟

来源标题:“科技+文旅”让红色文化活起来 爱奇艺《长征·四渡赤水》全感剧场落地西安、常熟“很震撼,仿佛亲身经历了四渡赤水战役。”“体验完后深刻感受到革命先驱的不易。
Anthropic AI 最新研究成果发布:揭示大模型中的注意力回路

语言模型怎么“知道”乔丹是篮球运动员的?近日,Anthropic通过构建归因图呈现了语言模型处理这一问题时的底层机制。由下图可以看到,对于"Fact: Michael Jordan play
泛黄寻人启事暗藏惊天阴谋 《利剑·玫瑰》定档7.28剑指打拐风暴

来源标题:泛黄寻人启事暗藏惊天阴谋 《利剑·玫瑰》定档7.28剑指打拐风暴由中央电视台、腾讯视频、北京中视雅韵文化传播中心联合出品,北京合理影视有限公司承制,李晋瑞导演执导,慧东总编剧,迪丽热巴、金世
周杰伦入驻抖音取名周同学,平台否认9位数签约费

7月9日,歌手周杰伦正式入驻抖音,开通了他第二个中文社交媒体账号,取名“周同学”,头像是他的玩偶形象。抖音称“花9位数签周杰伦”不属实。
重温!中国动画电影经典之作

来源标题:重温!中国动画电影经典之作综合频道CCTV-1)动画电影展播将在暑期《第一动画乐园》集中推出中国动画电影的经典之作,它们承载着几代人的童年回忆和对未来的梦想,也鼓舞着几代人在成长中砥砺前行。
多部新片带来共鸣与震撼 高温天气反衬影院凉爽宜人 暑期档电影市场渐入佳境

来源标题:多部新片带来共鸣与震撼 高温天气反衬影院凉爽宜人 暑期档电影市场渐入佳境进入7月后,在一众备受期待的新片加持下,7月5日、6日全国大盘连续突破1.5亿元,影院的人气逐渐旺起来了,暑期档渐入佳
哥大最新调研:多款 AI 搜索引用错误率高达 60%,付费版本错误率更高

AI 搜索工具在美国很火,几乎四分之一的美国人都表示他们已经用 AI 来取代了传统的搜索引擎。然而在享受便捷的同时,也潜藏着诸多问题。例如,AI 会直接引用网络上原始文章的内容,但这些内容是否符合指令
云南威信县黑龙村强降雨疑似致5人失联

据央视新闻消息,7月8日7时至9日14时,云南昭通市遭遇大范围暴雨、局部特大暴雨袭击,其中威信县最大降雨量达254.4毫米,刷新该站点自1958年建站以来的单日最高纪录。据初步排查,威信县罗布镇黑龙村
哥大最新调研:多款 AI 搜索引用错误率高达 60%,付费版本错误率更高

AI 搜索工具在美国很火,几乎四分之一的美国人都表示他们已经用 AI 来取代了传统的搜索引擎。然而在享受便捷的同时,也潜藏着诸多问题。例如,AI 会直接引用网络上原始文章的内容,但这些内容是否符合指令
蚂蚁集团官宣开源统一多模态大模型Ming

5月27日,在蚂蚁技术日上,蚂蚁集团旗下的百灵大模型Ling)团队宣布正式开源统一多模态大模型Ming-lite-omni。据蚂蚁方面介绍,这是一款基于Ling-lite构建的MoE架构的全模态模型,
美食纪录片《味道大师》上线,八大基础口味皆是时代镜像

来源标题: 美食纪录片《味道大师》上线,八大基础口味皆是时代镜像5月7日,由广州映象文化出品的美食纪录片《味道大师》在腾讯视频正式上线。这是国内首部以“中国人的八大基本口味”为