高通押注混合AI，终端侧或将运行100亿参数模型

2022年末，美国人工智能公司Open AI推出了ChatGPT对话模型，迅速风靡全球并快速迭代，其在不到4个月后又发布了能力更强大的GPT-4，而后乘胜追击，推出了联网和第三方应用插件功能，不断刷新人们对生成式AI强大能力的认知。毫无疑问，生成式AI带来的巨大机遇将成为业界变革的转折点。

(资料图片)

然而，随着生成式 AI 模型使用量和复杂性的不断增长，仅在云端进行推理并“不划算”，因为包括硬件、场地、能耗、运营、额外带宽和网络传输在内的数据中心基础设施成本也将持续增加。而将一些处理从云端转移到边缘终端，则可以减轻云基础设施的压力并减少开支。这也是为何混合 AI 对生成式 AI 的规模化应用至关重要。

高通技术公司作为终端侧AI领导者，面向包括手机、汽车、XR头显与眼镜、PC和物联网等在内的数十亿边缘终端，可以提供行业领先的硬件和软件解决方案，对推动混合AI规模化扩展独具优势。6月16日，高通正式发布了白皮书《混合AI是AI的未来》，进一步阐释了混合AI在大模型时代的优势，以及高通如何凭借终端侧AI领导力、全球化规模和生态系统赋能，让混合AI成为现实。

“混合AI是AI的未来”

所谓的混合AI是指终端和云端协同工作，在适当的场景和时间下分配AI计算的工作负载，以提供更好的体验，并高效利用资源。在一些场景下，计算将主要以终端为中心，在必要时向云端分流任务。在以云为中心的场景下，终端将根据自身能力，在可能的情况下从云端分担一些AI工作负载。而混合AI架构可以根据模型和查询需求的复杂度等因素，选择不同方式在云端和终端侧之间分配处理负载。例如，如果模型大小、提示(prompt)和生成长度小于某个限定值，并且能够提供可接受的精确度，推理即可完全在终端侧进行。如果是更复杂的任务，模型则可以跨云端和终端运行。

此外，混合AI还能支持模型在终端侧和云端同时运行，也就是在终端侧运行轻量版模型时，在云端并行处理完整模型的多个标记(token)，并在需要时更正终端侧的处理结果。更重要的是，随着强大的生成式AI模型不断缩小，以及终端侧处理能力的持续提升，混合AI的潜力将会进一步增长。参数超过10亿的AI模型已经能够在手机上运行，且性能和精度达到与云端相似的水平。不久的将来，拥有100亿或更高参数的模型将能够在终端上运行。混合AI可以说是能够适用于几乎所有生成式AI应用和终端领域，包括手机、笔记本电脑、XR头显、汽车和物联网，并在成本、能耗、性能、隐私、安全和个性化体验方面更具优势。

例如，在成本方面，生成式 AI 搜索可以提供更加出色的用户体验和搜索结果，但每一次搜索查询，其成本是传统搜索方法的10倍。所以，当前面向大语言模型推理的云计算架构，将导致搜索引擎企业的运营成本升高。但混合AI能够利用现已部署的、具备 AI 能力的数十亿边缘终端，以及未来还将具备更高处理能力的数十亿终端，在一定程度上减轻运营成本压力。

在能耗方面，边缘终端能够以很低的能耗运行生成式AI模型，尤其是将处理和数据传输相结合时。而在时延方面，当生成式 AI 查询对于云的需求达到高峰期时，会产生大量排队等待和高时延，甚至可能出现拒绝服务的情况，向边缘终端转移计算负载可防止这一现象发生。

高通全栈AI优化

众所周知，高通已经将其AI能力带入了包括智能手机、笔记本电脑、PC、汽车在内的众多终端产品中，其终端侧AI技术在大模型时代下也将成为推动混合AI规模化落地的重要推力。据高通技术公司产品管理高级副总裁兼AI负责人Ziad Asghar介绍，高通已经在飞行模式下实现了全球首个Android手机上的Stable Diffusion终端侧演示。Stable Diffusion是一个参数超过10亿的超大神经网络基础模型，能够基于输入的文本提示生成图片。而通过高通的全栈AI优化，这一模型能够完全在终端侧运行，实现在15秒内完成20步推理，生成饱含细节的图像。

Ziad Asghar也直言，虽然高通目前已经能够支持Stable Diffusion这一超过10亿参数的模型在终端侧运行，但许多关键的生成式AI模型的规模可以达到10亿到100亿参数之间，例如文本生成图像、自然语言处理、编程、图像理解、图像创作等。所以，在未来几个月内，高通将有望支持参数超过100亿的模型在终端侧运行。而这无疑也将成为基于高通技术的产品的重要差异化优势。

此外，通过高通AI软件栈，高通已经实现在搭载骁龙计算平台的笔记本电脑上运行Stable Diffusion。凭借行业领先的高通AI引擎，基于骁龙计算平台的笔记本电脑在MLCommons V3.0上率先实现了出色的MLPerf基准测试结果。同时，高通也是唯一一家能够在MLCommons V3.0的笔记本电脑品类中获得测试结果的公司，这也正是因为其拥有能够在终端侧运行如此大规模AI用例的硬件引擎。

其实，早在2022年6月，高通就推出了专门面向边缘侧AI的领先软件栈产品——高通AI软件栈，将其所有相关的 AI 软件产品集成在统一的解决方案中。OEM 厂商和开发者可在其产品上创建、优化和部署 AI 应用，充分利用高通 AI 引擎性能，让 AI 开发者创建一次 AI模型，即可跨高通所有硬件运行 AI 负载。谈及高通AI软件栈的核心优势，Ziad Asghar表示，基于高通AI软件栈的模型一旦开发出来，就可以在不同地方使用，再与混合AI部署相结合，形成杀手级的组合，将帮助生成式AI在不同终端上进行规模化扩展，实现生成式AI的普及。

未来，高通将不断提高边缘侧支持的模型参数阈值，Ziad Asghar提出，在不久的将来，拥有100亿或更大参数的生成式AI模型将能够在终端上运行。

高通押注混合AI，终端侧或将运行100亿参数模型

高通押注混合AI，终端侧或将运行100亿参数模型

邢台养护工区多举措做好端午节安全保畅工作|天天新要闻

艾多美微笑行动「美姑站」圆满成功_当前速读

环球观速讯丨关于炎亚纶不雅事件持续发酵及炎亚纶不雅事件持续发酵详情

今日热搜：中国跳水队举行世锦赛“一模”

图形用户界面如何保护？上海法院这么判

山东：明确项目分四个类型，建立动态调整机制

good doctors韩版_good doctor韩剧网

太阳GM：无论是场上还是场下 保罗都对我们产生了不可估量的影响 全球即时看

盈通显卡生产日期怎么看_盈通显卡

俄罗斯内战爆发，25000名雇佣军造反，50公里车队离开阵地杀回国

色即是空男演员名字_色即是空演员表

北京降级发布高温黄色预警信号

美方在第三国诱捕并起诉中国公民 中方严正交涉

高温值守，局地超40℃，还要热几天？_全球焦点

天天微速讯：马卡：若沃克离队瓜帅将阿什拉夫视为替代者，曼城愿开出高价

运动神经元的鉴别诊断？ 全球消息

arctan计算器在线使用 arctan计算 全球速读

环球焦点！领地控股：一笔已展期一年的1.194亿元美元票据再次违约

世界新动态：衡水五中是公立还是私立_衡水五中

女巫的扫把叫什么名_巫女的扫把叫什么 新动态

克6：若我是利拉德我会给亨德森半个赛季 看他能否有全明星的水平 消息

端午文创走俏 传统文化创新表达_环球快播报

【环球财经】伦敦金属交易所基本金属23日多数下跌

夏季不想被蚊虫“亲吻”，请get这些小妙招！

前5月海南实际使用外资同比增长35.4% 每日快播

我害怕歌词薛之谦英文（我害怕歌词）

2024年巴黎奥运会火炬传递路线公布|全球快看点

【环球播资讯】读书手抄报内容古诗大全（读书手抄报内容古诗）

特斯拉车主自曝：“差点儿闷死在车里！”这是啥情况？ 世界通讯

世界微动态丨柯希·皮尔南_关于柯希·皮尔南概略

通城食材来汉促销，23日最后一天！|天天最新

成都白颠风医院哪家好_天天观点

有关校园的英语演讲2023 全球报资讯

工信部：前五个月电信业务总量同比增17.2%

新生儿拉肚子是什么原因造成的_新生儿拉肚子症状表现 环球关注

热搜，今年首个！杭州刚刚发出紧急预警，它“暴力”上线！今起连续4天……

【天天快播报】初中相思的古诗有哪些 有哪些关于相思的古诗词?

观热点：抓好安全文化建设要做到有的放矢

今日视点：今起陆续出分！31省份高考成绩查询时间汇总

环球时讯：疃怎么读_闇怎么读

邓兆朋调研鄄城县重点项目建设和安全生产工作

怎么清理微信 ？只会删除聊天记录？教你一招直接“深度清理”-焦点热讯

北京：立刻开展燃气领域隐患排查整治 不留死角、不留空白|天天关注

击剑亚锦赛无锡收官 中国队斩获2金3银6铜

废墟中冒出滚滚浓烟！巴黎一建筑发生爆炸起火致37伤

安全最“粽”要！这份出行安全提示请收好

哀牢山四名地质人死亡原因_4名地质人员遇难

大叔好凶猛_嗯我要快进来|世界报资讯

炎蹄_关于炎蹄介绍

百事通！端午节开启新一轮升温

【全球播资讯】森林工程学

里字笔顺教学_里字笔顺

异形大战铁血战士3|当前观点

梦见生女孩预兆什么 周公解梦

每日关注!蔚来手机发布在即：有机会成车主“备用机”，但难成气候

深水物探船、深水半潜式钻井平台……中国海洋工程超级装备相继投入使用

今日关注：乌鲁木齐经开区驻区企业扩大产能 为更多产品“穿好”外衣

人一辈子，要学会舍得

世界今日报丨宜春远大生物工程有限公司

土耳其邪教头目被判8658年：洗脑上千女性，别墅有69000颗避孕药

保险业务员主要工作内容怎么写_保险业务员工作描述 世界今亮点

山钢股份营销总公司“一人一表”绩效管理体系成效初显

环球速看：多地再掀购车补贴潮：车市“价格战”仍将持续？

全球看点：洪都拉斯监狱暴乱已导致46人死亡

环球播报:牛腿肉和牛腱子肉有什么区别图片（哪个部位肉最贵更好吃）

激活数据要素潜能，数据要素统一大市场对接活动在郑州举行 |环球新要闻

如此强大的免费图片处理神器，居然今天才被我发现..

今日端午丨五月五过端午，祝您万事顺遂，端午安康|天天新要闻

前沿资讯!为“最美滴滴司机”颁奖，CBD基层工会为新业态从业人员提供多元服务

当虹科技：股东拟减持不超过2.90%的股份 当前播报

世界最新：事关厦门中考！交警发布提醒

观速讯丨心无旁骛的意思解释_心无旁骛的意思

国家新闻出版署发布6月国产网游审批信息，89款游戏获批

抵制过度包装！北京消协发布端午节消费提示

临夏州代表队在甘肃省青少年三人篮球锦标赛中夺冠

慈利法院：送法进机关 规范依法行政|每日焦点

证券板块跌1.77% 哈投股份跌0.2%跌幅最小_当前焦点

焦点观察：深圳铁路7月1日起实行新的列车运行图

太阳GM：无论是场上还是场下保罗都对我们产生了不可估量的影响全球即时看

美方在第三国诱捕并起诉中国公民中方严正交涉

运动神经元的鉴别诊断？全球消息

arctan计算器在线使用 arctan计算全球速读

女巫的扫把叫什么名_巫女的扫把叫什么新动态

克6：若我是利拉德我会给亨德森半个赛季看他能否有全明星的水平消息

端午文创走俏传统文化创新表达_环球快播报

特斯拉车主自曝：“差点儿闷死在车里！”这是啥情况？世界通讯

新生儿拉肚子是什么原因造成的_新生儿拉肚子症状表现环球关注

【天天快播报】初中相思的古诗有哪些有哪些关于相思的古诗词?

怎么清理微信？只会删除聊天记录？教你一招直接“深度清理”-焦点热讯

北京：立刻开展燃气领域隐患排查整治不留死角、不留空白|天天关注

击剑亚锦赛无锡收官中国队斩获2金3银6铜

梦见生女孩预兆什么周公解梦

今日关注：乌鲁木齐经开区驻区企业扩大产能为更多产品“穿好”外衣

保险业务员主要工作内容怎么写_保险业务员工作描述世界今亮点

当虹科技：股东拟减持不超过2.90%的股份当前播报

慈利法院：送法进机关规范依法行政|每日焦点

俄国防部：乌方无人机袭击莫斯科州遭俄电子战压制

高锰酸钾制取氧气简图高锰酸钾制取氧气装置图|天天信息

新天科技设智慧科技子公司业务含物联网应用服务_世界短讯

世界热资讯！连云港旅游年卡在哪里续费连云港旅游年卡有效期查询系统

高考查分哪里查高考查分数需要什么信息怎么查？世界最资讯

撑“大”了的胃还能这样“缩”回去

金乡县卜集镇开展端午节“粽情众意”走访慰问活动今日精选

暗黑破坏神4永生威能有什么特点暗黑破坏神4永生威能介绍天天要闻

北京君正：目前RISC-V CPU核尚在研发中，RISC-V V2尚未应用于公司产品中天天新视野

如何给洗衣机消毒_怎样给洗衣机消毒全球看热讯

世界视点！CPO概念股持续活跃光迅科技涨停

2023广东高考6月25日放榜｜早安广东环球短讯