Intel酷睿Ultra NPU AI加速库开源:但功能残缺不全
老翟笔记3月4日资讯,Intel已经将NPU加速库开源并放上GitHub,使得基于酷睿Ultra处理器的AI PC可以运行TinyLlama、Gemma-2b之类的轻量级大语言模型。
酷睿Ultra首次引入了NPU AI引擎,可以执行一些轻负载的AI推理任务,并与CPU、GPU搭配处理各种AI工作。
这次开源的NPU加速库,当然是面向开发人员的,但如果你有一定的编程经验,也可以拿来体验体验。
Intel软件架构师Tony Mongkolsmai展示了利用此开源的NPU加速库,在一台微星尊爵14 AI Evo笔记本上,基于11亿参数的TinyLlma大模型,运行了一个AI聊天机器人,可以进行简单对话。
同时,Windows任务管理器显示,NPU确实被调动起来了。
不过,开源NPU加速库目前的功能还很残缺,支持了8比特量化、FP16精度,但还不支持4比特量化、BF16精度、NPU/GPU混合计算等等,技术文档也没有。
Intel承诺,后续会逐渐增加更多功能,比现在要多一倍。
- 随机文章
- 热门文章
- 热评文章
- 什么是i人和e人?
- OPPO在MWC发布了智能眼镜OPPO Air Glass 3
- 特斯拉Roadster跑车要来了!马斯克:生产设计已完成计划年底推出
- 首例厂商担责的无人驾驶:路特斯发布“平行车手”功能
- 小米之家科技有限公司新增多项汽车业务:包含整车销售、代驾服务等
- 小米汽车何时上市 售车资质刚定了!
- 目标2030年前实现中国人首次登陆月球!着陆器、登月服进入研制阶段
- 亚马逊将推出彩色版Kindle:采用元太彩色电子纸技术