清华大学郑纬民:国产芯片核心问题并非硬件质量而是生态单薄;需求加速研制国产类CUDA体系和根底软件
5月17日,清华由搜狐主办的大学单薄2025搜狐科技年度论坛在北京隆重开幕。多位院士、郑纬科学家与产业界人士齐聚一堂,民国激起才智的产芯深度磕碰,奔赴科技的片核星斗大海。
本届论坛线上线下结合,心问需求系和敞开全天的题并A体思维盛宴。在下午的非硬现场环节,清华大学计算机系教授、质加速我国工程院院士郑纬民宣布了题为《人工智能大模型的量而类根底设施建造与使用探究》的讲演。
郑纬民院士指出,生态2025年人工智能开展出现两大特色:榜首个是研制多模态,大模型能处理文字、国产根底图画、软件视频。第二个是使用于GDP密切相关的职业,我国在推进AI落当地面具有明显优势。
他进一步向咱们介绍,人工智能大模型的生命周期首要包含五个环节:数据获取、预处理、模型练习、微谐和推理。前三个环节需求许多算力和存储资源,一般由大型科技公司如阿里、华为、DeepSeek等完结。一般单位只需根据已有根底模型进行范畴适配的微谐和后续的推理使用。
郑纬民院士提出,当时大模型练习首要依靠两类体系:一是英伟达GPU,其硬件功能与生态成熟度抢先,但面对禁售、价格高涨和一卡难求的窘境;二是国产芯片,全国已有3万余家企业投入研制,硬件功能逐渐进步,但中心妨碍在于生态兼容性缺乏。
对此,郑纬民院士主张从两方面打破,一方面构建“类 CUDA”体系,保证下降开发者学习本钱,经过习气搬迁重塑生态;另一方面进步国产卡硬件功能至国外同类产品的60%以上(若达 70%~80%更佳),即使起步晚、进程难,只需功能根本合格,合作生态优化,仍可招引用户。此外,还需会集资源做好一些中心软件。
然后,郑纬民院士还以大模型练习中的容错难题、长上下文推理的内存瓶颈,以及算力资源对立等实际问题为例,介绍了一些当时模型练习和推理中面对的应战。
清华大学计算机系教授、我国工程院院士郑纬民。
以下为讲演摘抄:。
现在人工智能2025年大模型两个特色。榜首个特色,多模态。这个大模型能处理文字、图画、视频。第二个,真实把它用起来了,用到了跟GDP直接相关的职业。方才几位说的时分,我国人最拿手做这件事,把这个东西使用于跟GDP直接相关的职业。
下面跟咱们简略说说人工智能的五个大周期,生命周期里边五个环节。
榜首,大模型最重要的工作便是模型练习,练习的便是数据,数据拿机器练习。榜首件工作,数据获取。从世界各地能拿到数据的当地把数据拿来,拿来到咱们的实验室的硬盘。
第二个工作,数据预处理。方才拿来的数据有重复的、有广告、格局不相同,也便是质量不太高。经过预处理把这个质量进步,这件工作做起来,GPT4要做半年预处理。预处理完今后,数据质量高了。
第三个,模型练习。这个时刻也很长,设备也许多。最终练习完今后得到一个根底大模型。
第四个,模型微调。把第三个进程出来的根底大模型,假设用在医院,这个还不可,它还不怎么会治病。首要原因,模型练习的时分,医院的数据太少了。因而,在根底大模型的根底上,把医院的数据再第2次练习,叫微调,出来的便是医院大模型,它能治病了。根底大模型要用到金融,直接用还不可,首要是金融数据练习太少。因而,在根底大模型根底上,把金融的数据第2次练习,咱们叫微调,得到一个金融大模型。模型微调,实际上便是在根底大模型根底上,对某一个范畴数据第2次练习,得到某一个范畴的大模型。
最终一个,模型推理,真实把它用起来了。
这五个环节,榜首、第二、第三需求大机器、大存储,一般单位不要做这件事。比方你是医院,医院不要做这件事,前面三件工作不要做。谁能做呢?DeepSeek也在做、阿里也在做、华为也在做,他们会最终出来一个根底大模型,咱们在根底大模型的根底上下载一个根底大模型,做医院的模型微调。前面三个,一般单位都不要做,咱们只做对医院来说便是模型微调,这是要做的。
第四、第五个推理,每个人都有联系。构建国产自然体系的根底软件非常重要。现在支撑大模型练习的有三个体系,榜首个是根据英伟达公司的GPU,硬件功能好,生态好,可是问题是人家不卖了,价格贵了好几倍,一卡难求。第二个,国产体系,最近几年全国差不多有3万来家公司出产AI芯片,发展也是不错了,可是什么现状呢,国产的卡不太喜爱用,不是它的硬件质量欠好,而是它的生态欠好。
这件工作很重要,要改动生态我以为要做两件事。榜首个,建一个类CUDA体系,什么叫生态,便是习气了、喜爱用就叫生态体系。英伟达体系有一个叫CUDA,把CUDA学会了就会编软件了。现在许多年了,许多人都喜爱CUDA,国产的体系假如不是CUDA的,人家就不喜爱,就不喜爱用。因而,我觉得咱们要建一个类CUDA,虽然是国产卡的体系,可是编软件的时分跟CUDA相同,这个工作能够做的,没问题的。
第二个,国产卡的硬件体系假如能得到国外同类体系的60%,不是说60%就够了,到70%、80%就更好,可是咱们晚,进程也比较困难。只需到达60%,把生态做好了,咱们也会喜爱用。现在咱们感觉到欠好用,不是由于硬件功能欠好,而是生态不太好。一个是做类CUDA,还有一个是做10个软件。
(责任编辑:探索)
-
陈芋汐在竞赛中 拍摄:楚天都市报极目新闻记者宋枕涛。楚天都市报极目新闻讯记者胡迪凯)5月25日晚,2025年全国跳水冠军赛进行了女子十米跳台决赛。上海选手陈芋汐以413.85分的成果强势夺冠。本次女 ...[详细]
-
China and Cambodia are ironclad friends who always support each other and stand together through thi ...[详细]
-
白叟取出3万元积储寄给骗子 武汉民警赶赴外省截获用衣服包裹现金的快递
3万元现金塞在衣服内口袋里 通讯员供图。□楚天都市报极目新闻记者 吴昌华 通讯员 孙逊。一位白叟接到骗子的电话后信以为真,取出自己的悉数积储共3万元现金,用衣服包裹得结结实实,到快递站寄给骗子指定的收 ...[详细]
-
.。荆楚网湖北日报网)讯通讯员 王辛未、黄晓燕)。“以往就事得往社区跑,现在在小区里就能轻松搞定,实在太快捷了!”4月16日,大冶市东岳路大街保康社区的雷奶奶,在顺利完成社保待遇资历认证后,满脸洋溢着 ...[详细]
-
中新社伦敦5月23日电 (记者 欧阳开宇)2025我国电影节当地时间23日在伦敦摄政街电影院正式拉开帷幕。本次电影节为期四天,将展映《里斯本丸淹没》《我和我的父辈》《音乐家》《哪吒2》等我国电影精品力 ...[详细]
-
4月17日,从联合国教科文组织传来好消息——。新一批文献遗产列入《国际回忆名录》,国际回忆再添名贵财富。其间包含我国申报的《随州曾侯乙编钟》《少林寺碑碣566—1990)》,以及我国与斯里兰卡联合申报 ...[详细]
-
湖北施行林业五大行意向支点建造聚集发力 2030年工业规划打破1万亿元
湖北日报讯 记者汪训前、通讯员周仲盛、杨光亮)近来,湖北省林业局出台《加速建成中部地区兴起重要战略支点林业举动计划》,聚集服务全省七大战略,以“提质、兴业、利民”为主攻方向,推进施行林业五大举动,全力 ...[详细]
-
极目新闻通讯员 曾甜甜 柯美中。旁人每押必中,张狂赢钱,摊主一脸愁闷,捶胸顿足,引得围观路人纷繁下场投注。看似轻松赚钱,却是“摊主”和“托”的倾情演绎,上演了一场骗钱的“剧本杀”。方某家等人纠合一同, ...[详细]
-
16.8%、34.1%,增长势头微弱!多维数据透视1至4月机械工业成绩单
央视网音讯:记者5月23日从我国机械工业联合会得悉,2025年1—4月份,我国机械工业出产及出资均稳定增加。最新数据显现,2025年前4个月,机械工业首要触及的5大类职业增加值同比坚持增加趋势。详细来 ...[详细]
-
医患共唱传递生命期望 武汉市中心医院立异疗法点亮晚期患者重生
视频:武汉市中心医院杨春湖院区肿瘤科立异疗法。荆楚网湖北日报网)讯记者 林琳 通讯员 马遥遥)。“祝你平安,噢祝你平安,你永久都美好是我最大的愿望……”4月17日下午,在武汉市中心医院杨春湖院区肿瘤科 ...[详细]