👨💻💡🎯聚焦开发者
“I”:视频输入。GPT-4V对视频的理解还相当原始,因为它将视频视为一系列离散图像。减少信息冗余的最聪明方法是什么?学习目标应该是什么?下一帧预测与下一个单词预测有着明显的类比关系,但它是否是最佳的?如何与语言交错?如何引导机器人和人工智能的视频学习?业界尚未达成共识。
在得到一系列离散代码之后,就可以像处理语言词向量一样,输入到预训练的大语言模型,最终生成翻译的文本内容。
展望未来,雷军表示小米新十年的目标是成为全球新一代技术领导者。这是一条长路,需要保持初心、持续努力。公司将继续大力投入基础科技研发,也会加强工程师队伍建设。在技术创新的征程上,小米定会走得更远。
到2025年底,这一行动计划将继续推进,实现超过12万个重点场所的移动网络深度覆盖,覆盖3万公里铁路和50万公里公路以及200条地铁线路。5G网络的覆盖深度和广度也将得到持续完善,同时5G流量占比将显著提升。