大模型迭代加速终端演进，有什么新挑战？

栏目：消费作者：文辉发布时间：2024-06-09 12:03 阅读量：14753

虽然对于不少硬件来说，AI技术早在多年前已渗透到日常功能中，但真正有望带来颠覆性改变还是AI大模型的到来和落地应用。

近日举行的阿里云深圳AI峰会上，阿里云智能集团副总裁、公共云首席解决方案架构师韩鸿源在演讲中回顾分析，云计算的发展伴随新技术爆炸和新业务爆发而持续迭代，发展至今大概经历了六个阶段，人工智能泛在存在正成为新趋势。

这也意味着更多类型终端产品和应用将持续演进和迭代，应对模型落地挑战。

北科瑞声创始人、国家重大人才计划特聘专家刘轶指出，电脑、手机、手表等终端是离用户最近的信息入口，大模型与终端的结合将加快AI技术普及。

“在大模型时代，第五代人机交互模式将取代第四代，也就是苹果率先推出的触控模式。后续将跟人之间交流一样，用自然语言交互让机器明白人的意图。那么就可能在设备端出现私有化的个人助理，甚至可以落地在汽车、平板甚至手表、手环上。”他续称，产业界也应协作推动大模型应用落地。

持续迭代

按照发展阶段来看，韩鸿源指出，最开始，云计算承载的是把线下的IT技术能力搬到云上，目的是降低成本和方便管理能力提升，到今天为止很多人对云计算的认识依然停留在这一阶段。

实际上经过初期管理能力和成本优化阶段后，云上诞生了云原生这类新的开发范式，由此加速了应用和能力的迭代提升，也促进云计算本身发展。

云原生技术普及后，下一个阶段诞生了很多先进架构需求，这来自于越来越多关键业务被承载在云上后，提出了新需求。例如通过软件定义的方式，做到高可靠性和高可用性。

此后便迎来全球化蓬勃发展，近些年来全球化过程中的云计算，面临如合规、数据主权等话题，此后通过很多工作解决掉了绝大部分担心。由此也促成国内企业蓬勃地出海发展。

近两年来，随着生成式AI爆发，对基础设施和基础能力提出新需求。“预计随着AI持续发展和成本持续降低，AI会无处不在，就进入了人工智能泛在的新发展阶段，我们在铺平需要的所有技术能力和手段准备。”他表示。

韩鸿源指出，生成式AI正对计算、数据、开发、部署等多个维度的技术能力提出新挑战。例如计算能力从PFLOPS至EFLOPS计算量需求，且要持续运行一个训练任务从数天至数月；数据量则是TB级至PB级的体量会常态化参与到计算过程中，才能产生想要的结果等。整体看，目前已有70%的组织在使用云上托管的AI服务。

目前看到的新发展方向是模型即服务。他进一步分析道，传统意义上会认为云计算是由基础设施和软件层技术来帮助实现。但随着人工智能发展，今天需要把另一个因素引进到技术栈中，就是“模型即服务”能力。此前IaaS、PaaS是更偏传统计算机架构下有效执行的能力，但到今天以模型和AI为中心时，神经网络会成为计算能力一个基础的组成部分，经网络计算方式会跟以前传统机器学习的方式有很大差异，结合新方式引入会带来很多变化，如资源池、管理方式、技术能力等。由此，未来将是IaaS+PaaS+MaaS三个方向共同结合支撑业务系统和应用有效地运行和发展。

基于这些思考和观察，通义模型系列也在持续迭代和完善生态。通义系列模型正式发布始于2022年9月；2023年10月通义系列应用发布，同时通义千问2.0发布，彼时已经具备主流先进模型能力；此外也在着手开源贡献，2024年4月，通义千亿级模型开源；期间也在构建开放社区推动商业化应用。

落地挑战

当然大模型的出现并持续迭代，也为端侧落地带来新的变量和挑战。

优必选科技副总裁、研究院副院长庞建新分享道，大模型的出现，对端侧的多模感知、任务决策和规划等提出新挑战。例如多模态感知方面，将不止包括语音和环境感知，还需要结合知识和上下文；在场景落地方面，此前手动输入了诸多条件，但随着环境优化，大模型的能力落地需要一定程度重新规划和执行。

OPPO AI技术战略规划总监陈晓春则表示，虽然AI技术已经存在了很长时间，但真正能感受到体验切实改变还是从生成式AI开始。对此，OPPO的思考是，一开始探索全域个人助理，此后是落地到本地完成一定工作；再是本地APP如何与手机结合，解决用户在手机端时间碎片化的问题。

对于手机端研发来说面临的挑战包括:一方面是时延，例如在海外手机漫游场景下如何完成端侧的实时翻译能力；其二是高隐私，端侧的意图推理具备一定隐私属性，那么在端云协同之间如何完善安全保障措施；其三是如何平衡功耗和成本，“模型在端侧运行不需要那么大，那么遇到多种感知和大模型结合的情况下，很多小尺寸甚至传统方案就要引用刚进来。”

刘轶分析道，AI在语音方面的发展对市场进行过两次较为重要的教育。第一次是Siri推出，在手表、手机上具备语音交互能力，但当时受限于算法和算力条件，并未达到多数用户的期望效果；第二次就是近期，GPT-4o的展示显示出其已经可以像人一样具备低延迟、快速理解能力。

但国内能够把语音相关交互落地成产品，真正离线落地的终端很少，这是伴随了诸多挑战和壁垒。“比如我认为7B规模的端侧模式是极限，但可能会因为用户体验问题，影响到落地在手机和平板上的产品完善；1B规模很多人在研究，但可能是面向特定行业和领域。那么最终就要与传统的处理方法，例如知识图谱、增强搜索能力关联。再真正达到可用的现实效果。”

诸多头部终端厂商都在大模型领域与阿里云深度合作，以期探索并提升产品智能化体验。

庞建新指出，优必选通过与阿里云开展大模型相关合作，希望解决如何用开源大模型，根据场景做调参技术优化、端侧部署和云端部署协同等问题。“我们相信，端云结合是短期必须落实的问题，这对知识和内容有很大依赖度，中间如何调度需要厂商自己解决，根据形态和场景任务来推进。”

OPPO也一直与通义系列模型在展开合作。“在多模态大模型加持下，人机交互侧将出现很大变革。更多服务和知识节点需要依赖云侧模型，那么就要跑在距离用户很近、算力较大的地方。算子、模型技术本身等方面，我们的研发项目都在紧密开展合作。”陈晓春分析道。

此外，vivo基于阿里云训练自研蓝心大模型，千卡大模型预训练性能接近LLaMA水平。目前，vivo蓝心大模型已对vivo手机的AI影像、智能助理、图文创作等场景进行了全面优化，并升级了视觉辅助产品“vivo看见”。

小鹏汽车也宣布，已在智能座舱场景中新增接入阿里云通义千问。在发布量产上车的端到端大模型后，小鹏成为同时将大模型落地座舱和智驾的车企。

对于产业界如何协作推动大模型应用落地，刘轶还指出，一方面要借鉴Open AI的分享和众筹机制，例如在应用中，阿里云提供通义系列底座，就需要结合千行百业，共同建设面向行业、好用的大模型；另一方面是如何做好端云协同，“语音交互在低算力条件下只能做到本地信号处理或压缩编码，更多要在云端处理，如何做好连接很重要，Rabbit R1就是在做一种尝试。”

分享到微信

免责声明：该文章系本站转载，旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议，仅供读者参考。

猜你喜欢

最新内容

热点内容