IT之家 9 月 27 日消息,苹果正在研发一款名为 Manzano 的新图像模型,旨在同时具备图像理解与图像生成两大能力。
不过目前 Manzano 尚未正式发布,也没有演示 Demo,只有一篇作者绝大多数都是华人的预印本论文(包括已经跳槽到 Meta 的庞若鸣),还展示了部分低分辨率图像样例,涵盖较复杂的提示场景。
苹果表示,这一双重功能长期以来是技术难点,使得大多数开源模型在综合表现上落后于 OpenAI 和 Google 等商业系统。
【资料图】
苹果将其与 DeepSeek Janus Pro 等 AI 模型进行了对比,结果显示 Manzano 不弱于 OpenAI GPT-4o 和谷歌的 Gemini 2.5 Flash Image Generation(IT之家注:原代号 Nano Banana)。
苹果指出,大多数开源模型在图像处理上存在取舍:要么擅长图像分析,要么擅长图像生成,而商业系统通常能兼顾。尤其在涉及大量文本的任务(如文档阅读、图表解读)时,现有模型表现不佳。问题根源在于图像处理方式:连续数据流更适合理解,而离散符号则更适合生成,多数模型为这两类任务分配不同工具,易引发冲突。
为此,Manzano 采用了混合图像分词器。其共享编码器可输出两类标记:连续标记(用于图像理解,以浮点数形式表达)和离散标记(用于图像生成,按固定类别划分)。由于二者源自同一编码器,因此其任务冲突显著减少。
Manzano 的整体架构包括三部分:混合分词器、统一语言模型,以及独立的图像解码器。苹果为解码器构建了三个版本,参数规模分别为 9 亿、17.5 亿和 35.2 亿,支持 256 像素至 2048 像素分辨率。
训练过程分为三个阶段,使用 23 亿对图像-文本样本(来自公开和内部数据),以及 10 亿对文本-图像样本,总计处理 1.6 万亿标记。部分训练数据来自合成生成,如 DALL-E3 和 ShareGPT-4o。
在内部测试中,Manzano 在 ScienceQA、MMMU 和 MathVista 等基准上表现优异,尤其在图表和文档分析等文字密集型任务中,300 亿参数版本成绩突出。扩展测试显示,模型性能随规模提升而持续改善,例如 30 亿参数版本在部分任务中比最小模型高出 10 分以上。
苹果还将统一模型与专业化系统对比,差距仅为个位数分值:在 30 亿参数版本中,差距不到 1 分。在图像生成测试中,Manzano 亦接近前列,可执行复杂指令、风格迁移、图像叠加与深度估计等任务。
苹果认为,Manzano 是现有模型的有力替代方案,其模块化设计可支持各部分独立更新,并借鉴不同研究领域的训练方法,有潜力推动未来多模态 AI 的发展。
不过,目前苹果的基础模型整体仍落后于行业领先者。即便推出新的端侧 AI 框架,苹果仍计划在 iOS 26 的 Apple Intelligence 中引入 OpenAI GPT-5。Manzano 展示了技术上的进展,但是否能减少对外部模型的依赖,还需未来版本进一步验证。
新化月报网报料热线:886 2395@qq.com
相关文章
最近更新
- 苹果探索自研多模态 AI 大模型 Manzano:兼具理解与生成能力2025-09-27
- 刹车!广州豹2-2遭10人嘉定汇龙读秒绝平 仍居中甲第3距铜梁龙2分|百事通2025-09-27
- 奇幻异世界“中国制造”,《刺杀小说家2》兵器花纹都出自博物馆 快讯2025-09-27
- 今日聚焦!开门红!德阳队“川超”首秀 2比0战胜甘孜2025-09-27
- 焦点滚动:固态电池聚合物电解质领域取得重要进展 9月以来融资客大手笔抢筹21只概念股2025-09-27
- 【新视野】中企在海外首个闪蒸地热电站顺利移交2025-09-27
- 固态电池聚合物电解质领域取得重要进展 9月以来融资客大手笔抢筹21只概念股_要闻速递2025-09-27
- 天天快报!都在做超级增程,广汽凭什么赢?2025-09-27
- 速看:统计局:1-8月份全国规模以上工业企业实现利润总额4.69万亿 同比增0.9%2025-09-27
- 突然!603356,控制权变更又终止|每日头条2025-09-27
- 焦点报道:近70件琉璃精品!“融·生——炉火不熄 万物共生”主展览开展2025-09-27
- 康缘药业公布“一种中药组合物在制备用于高血压药物中的应用”专利2025-09-27
- 青海贵南清洁供暖源网荷储一体化100兆瓦光伏项目并网发电2025-09-27
- 医疗机构门诊命名需规范,这家医院“亚健康专病门诊”专治各种“不得劲儿”|焦点热门2025-09-27
- 新资讯:11月1日,2025苏超决赛决战南京奥体之巅!极大可能再创观赛纪录2025-09-27
- 报道:浙江汉博汽车传感器取得一种护套的安装装置及其预压装置专利2025-09-27
- 因股权转让纠纷,顾洪迪起诉*ST新元2025-09-27
- 因买卖合同纠纷,科润智控起诉山东福祥电气有限公司-观热点2025-09-27
- 慈文传媒:推进短剧出海,整合海内外平台资源2025-09-27
- 动态:“洋学生”中国说|Z世代东盟青年话交融:以青春之力助推文明互鉴2025-09-27
- 无锡新进机械科技取得汽车配件速干沥水装置专利,缩短配件干燥时间2025-09-27
- 二氢吡啶商品报价动态(2025-09-27) 每日聚焦2025-09-27
- 中国中煤与保利集团签署深化战略合作协议|要闻2025-09-27
- 媒体人:勇士双向塔兰-阿姆斯特朗收到贝尔格莱德游击队合同报价2025-09-27
- 权威数读丨前8个月,规上工业企业利润实现同比增长2025-09-27
- 理想汽车申请资源分配方法相关专利,保证NPU内存访问请求任务高效执行2025-09-27
- 领益智造:公司与智元合资成立东莞领智创新机器人科技有限公司 独家焦点2025-09-27
- 一台“村晚”串起青岛崂山区王哥庄农文旅链条 2025年曲家庄省级村晚示范展演成功举办-焦点简讯2025-09-27
- 氨糖软骨素选什么牌子的 关节养护如何科学搭配更有效2025-09-27
- 氨糖软骨素最新排名 关节养护怎么选?这份全人群适配测评请收好2025-09-27