Hunt for News|先进头条️ 商汤科技创始人汤晓鸥离世,享年 55 岁
12 月 16 日傍晚,商汤科技发布讣告,人工智能科学家、浦江实验室主任、上海人工智能实验室主任、香港中文大学教授汤晓鸥因病救治无效,于 2023 年 12 月 15 日深夜 11 时 45 分去世。
图片来自:商汤科技 微信公众号
公开信息显示:
汤晓鸥于 1990 年从中国科学技术大学毕业;
1991 年获得美国罗切斯特大学硕士学位;
1996 年获得麻省理工学院博士学位,之后进入香港中文大学工作;
2001 年创立了香港中文大学多媒体实验室;
2005 年至 2007 年在微软亚洲研究院工作,担任视觉计算组主任;
2008 年在深圳先进技术研究院多媒体集成技术研究室工作,担任主任和研究员;
自 2009 年 1 月起担任中国科学院深圳先进技术研究院副院长;
2014 年 10 月,汤晓鸥正式成立商汤科技;
汤晓鸥主要从事计算机视觉相关领域的研究,包括多媒体、计算机视觉、模式识别及视频处理,是计算机视觉领域的领军者。他最后一次的公开亮相是在 2023 年的世界人工智能大会上。
上榜《自然》年度十大人物,GPT-4.5 再爆料
上周我们提到了 或将在本月内推出 GPT-4.5,而本周也有网友在 论坛分享了一张疑似 GPT-4.5 参数信息的照片。
照片显示,GPT-4.5 将带来跨语言、音频、视觉、视频和 3D 的多模态模型,具备复杂的推理和跨模态理解能力。
不过 对此并没有发表任何评论,但按捺不住的网友 @ 跑到 CEO Sam 评论区询问泄密照片的真实性,而他的回答是「nah」,俚语表示「否定」的意思。
值得一提的是,《自然》最近揭晓了 2023 年度十大人物('s 10),除了十位年度人物以外,非人类—— 也登上该榜单。
《自然》主编 Rich 解释说:「虽然 不算是人,也不完全满足 's 10 的评选条件,但生成式 AI 正在深刻改变科学的发展进程,所以我们破例将其纳入榜单。」
有趣的是, 的缔造者之一, 联合创始人 Ilya 也入选了该榜单,其他上榜的人物包括印度空间研究组织「月船 3 号」项目副主管 ·、美国国家点火装置首席设计师 Annie· 等。
_dunz//
真实照片和 AI 的「融合怪」或不具备版权
当地时间周一,美国版权局拒绝了艺术家 Ankit Sahni 对一件由人工智能基于他原创的照片及梵高的名画《星夜》生成的艺术作品的版权注册申请。
美国版权局解释称:「尽管 Ankit Sahni 声称该作品包含一些人类创造性的投入,但该作品依然不可注册,因为「这种人类作者身份无法与计算机程序产生的最终作品区分开来。」
以下是 Ankit Sahni 的「融合」成果
美国版权局还发现,这个 AI 艺术作品的新要素纯粹是由 AI 应用程序自动生成的。所以根据版权法的原则,没有人类原创性的贡献作为基础,该 AI 输出内容不具备获得版权保护的资格。
资深摄影师 @ 评价称,这位艺术家使用了梵高的作品,没有征得他许可,也没有对最终输出做出足够的创造性贡献和转换。所以从法律上讲,他对输出图像的版权声明站不住脚,最多只能与梵高本人共享部分版权。
时隔大半年, V6 即将发布
时隔大半年,文生图「领头羊」 V5 即将迎来大版本迭代升级。
在其官方 社区上组织了一次「评分派对」活动,目标是让付费会员参与评价 V6 版本生成的图像,并提供算法改进的反馈。
活动流程很简单,参与的人需要在两张 AI 生成图片选择自己认为更好的图片。通过统计这些选择偏好, 可以收集数据来优化他们的图像生成算法。
声称展示的照片是 「糟糕」的图片,下一次评级会将是 「好」的图片,但我们也可以提前从中一窥 V6 的实力。
近日,全球最大的开源大模型社区 Face 和国内权威大模型评测平台 分别公布了最新的开源大模型排行榜。
阿里云通义千问 720 亿参数的模型 Qwen-72B 力压 Llama 2 等国内外开源大模型,在两个排行榜上同时登顶榜首。
在 Face 六个维度的测评中,通义千问(Qwen-72B)表现抢眼,以 73.6 的综合得分在所有预训练模型中排名第一。
在国内权威开源大模型评测平台 的最新中文大模型榜单上,通义千问 72B 模型以 67.1 的综合得分夺冠。
✌️2023 年度中国媒体十大新词语发布,生成式人工智能入选
12 月 16 日,国家语言资源监测与研究中心发布「2023 年度中国媒体十大新词语」。
十大新词语分别为:生成式人工智能、全球文明倡议、村超、新质生产力、全国生态日、消费提振年、特种兵式旅游、显眼包、百模大战、墨子巡天。
让 DALL·E 3 生成的 自画像
国家语言资源监测与研究中心对生成式人工智能的解读如下
生成式人工智能指称一种通过学习大规模数据集生成新的原创内容的新型人工智能,它是基于算法、模型、规则生成文本、图片、声音、视频、代码等内容的技术。2023年以来,以 为代表的生成式人工智能成为全球科技热点,它不仅影响着人类的生活和生产方式,还为各种行业的创新和发展提供了新的工具和视角。
Hunt for Tools|先进工具 发布最强文生图大模型 2
本周 推出其最先进的文生图大模型 2,可提供与用户提示词紧密结合且一致的高质量、逼真的输出图像。毫不夸张地说,这可能是目前文生图效果的最高水准,
基于同一提示词,@ 博主分享了几张分别在 、 和 with Meta AI 上生成的照片。
表示,与第一代 相比,它在图像质量方面显著提高,并引入了新功能,包括渲染文本和 Logo 的能力。通过改变训练数据和方法, 2 能够生成更高分辨率、更美观的图像,与所提供的描述非常匹配。
目前,开发人员和云客户只能通过 Cloud AI 中的 API 来使用 2。由于 2尚未对外大规模开放,因此引发了不少网友的质疑。
网友 @ 表示:「像往常一样, 发布了一款大多数人都无法使用的产品,这有什么意义?!」
//
:SDXL 的 3D 扩展插件
AI 独角兽 AI 前不久低调发布了一款图片生成高质量 3D 的 AI 模型 。
据官方介绍,得益于创新的渲染方法和优化的模型结构, 不仅能够从单张图片生成高质量的 3D 模型,而且在训练效率上比原 模型提高了 40 倍。
此外, 可以与 XL 相结合使用,相当于 3D 模型的扩展插件。
目前, 已经发布于 Face平台,供研究人员和非商业用户下载和测试,但需要注意的是,该模型仅供研究目的,不可用于商业用途。
地址入口:
一分钟教会你「一键试衣」
买衣服却不知道上身效果如何,那你可以试试阿里巴巴最新的 AI 工具 。
体验地址入口:
Hunt for |先知 AI 将创造出比输家更多的赢家
印度 IT 巨头 Tech 候任首席执行官 Mohit Joshi 在 Zero Mile 会议上分享了关于人工智能是否会使编程工作变得多余的观点。
他说:「人工智能肯定会让编程变得更容易,并且会使其更加广泛。我不认为它会让编程工作变得多余。」
在他看来,人工智能确实做了一些了不起的事情,比如它可以让普通程序员达到了「专家」的水平,可以显著提高生产力。
Mohit Joshi 还表示:「人工智能将创造赢家和输家…人工智能将创造出比输家更多的赢家…这将使我们所有人受益匪浅。」
=
格莱美说唱歌手:有了 AI,我们正在(捣鼓出)一些真正危险的事情
曾获得 12 次格莱美奖的说唱歌手 Busta 最近对 AI 的潜在威胁和风险发出警告。
Busta 解释说:「如果你以某种方式说话,手机就会存储所有数据,然后它就会为你思考…手机正在夺走你的灵魂和你的想法,它正在成为你。」
「当你想到这一点时,这真的很奇怪,对吧?当 AI 进化到一定阶段,他们会让人类「见鬼去」吧!但我并不知道应对这种情况的解决方案。」
Busta 警告称:「有了 AI,我们正在(胡乱捣鼓出)一些真正危险的事情 」
⚡️ 之父:我不介意成为人类对 AI 恐惧的避雷针
当地时间 12 月 11 日, CEO Sam 出席了亚特兰大的希望全球论坛,这是他自 「宫斗大戏」之后首次公开露面。
表示, 的目标是继续倾听用户和更广泛社会的声音。此外,他也承认理解一些人对 公司技术可能被用来伤害人类的担忧。
他表示:「我认为人们对 AI 有很多焦虑,我明白,我也有这种感觉,他们需要一个人来投射这种焦虑,不幸的是,我暂时成为了那个人,不过也没关系。」
至于 AI 是否会抢走人类工作, 坦诚道:
「有一段时间,我非常担心人工智能会开始做每一项工作,从杂货店收银员到医生,但似乎正在发生的事情,我认为将会发生的事情比我想象的还要多。
最初的想法是,它将成为一种工具……改变人们的工作方式,就像手机、之前的互联网和之前的电脑一样。我们适应并寻找新的、更好的工作方式。」
Hunt for Fun|先行 草图秒变 3D 模型
人间一日,AI 一年,实时画图再次迎来进化。
据 @ 分享,最近 @ 推出了 Real-time to 3D 功能,该功能可以实时地将你的草图涂鸦生成 3D 模型,甚至还能导出到 3D 软件里面。