星洲网
星洲网
星洲网 登入
Newsletter|星洲网 Newsletter 联络我们|星洲网 联络我们 登广告|星洲网 登广告 关于我们|星洲网 关于我们 活动|星洲网 活动

ADVERTISEMENT

ADVERTISEMENT

人工智能

8小时前
18小时前
19小时前
20小时前
20小时前
1天前
1天前
1天前
1天前
1天前
DeepSeek的问世,将会让人工智能更快速地进入我们的个人生活,我们更需要学会接受和学习它,而不是还停留在嘲笑DeepSeek无法回答一些中国政治敏感话题。 上个月我提到了美国前总统拜登在卸任前几天所释出的高级芯片禁令,其中写到这纸禁令不但彰显了美国的霸权主义,而且也难以收获成效。文末,我用了中国的DeepSeek以及法国的Mistral AI作为例子,来证明小规模的大型语言模型(Large Language Model,以下简称LLM)是其中一条研发道路。 没想到,DeepSeek继续给人工智能领域丢下更多震撼弹,从十二月的v3版本,到一月的R1版本,甚至到了农历新年前还释出他们的图片识别模型Janus-Pro版本的论文。这些都宣告,人工智能以及LLM的研究不再是单纯依靠强大的GPU芯片来培养了。 DeepSeek在其v3版本中明确提到,训练过程中使用了2,048台英伟达H800 GPU(2022年面世),总成本不到600万美元。而拜登的芯片禁令则是以更高阶的英伟达X100 GPU为参照。 为了实现 “小而美” 的效果,DeepSeek只能在各种训练架构上做调整,例如划分更为细微的专家群(expert group),不断调整个别专家的权重等等。到了R1版本,DeepSeek搞出了一套不需要监督和微调数据(supervised fine-tuning)纯粹监督学习(Reinforcement Learning) 就能够逼得该模型 “思考” 的方法,并让该模型 “学会” 为同一道问题找到了不同的解法。 坦白说,读到R1论文时,我觉得这模型有种 “智慧觉醒” 的味道。这有点像下围棋的AlphaGo Zero依靠自行摸索,最后找了一条比人类还要强的围棋之道。 扯远了,让我们回来。因为DeepSeek的横空出世,许多科技股纷纷遭到无情抛售。这类新闻,我相信读者已经从各种平台看得差不多了。 但是,这就代表现在的AI相关公司完蛋了吗? 我觉得发展前景反而更好。 当初亚航刚开始运营时主打的口号 “人人都能飞” (Now Everyone Can Fly)DeepSeek也相似之处,就是让AI或者LLM这种高不可攀的技术门槛大幅拉低给小规模企业,甚至是个人。因此,从需求端来看,DeepSeek固然对英伟达高端芯片此时此刻的需求造成了短期冲击,因为客户会觉得自己可能不再需要花这么多钱,购买中端芯片即可。 不过,客户现在改买中端芯片,也是买,不是吗?而且更多人会有兴趣购买,不是吗? 况且,不同客户对芯片的需求有不同。没错,DeepSeek是在模型架构上杀出了一条血路,但是任何发展都有极限。当模型架构的潜力到了一个新的天花板时,硬件上的优势又会重新出现,不是吗?软硬件互相提升,是整个科技领域的常态。 一个市场有人把价格打下来,未必会让整个市场陷入价格战。你还需要审视这个市场是不是进入了成熟阶段。如果整个产业已经成熟,那么企业互打价格战,自然是越打越伤,但也会越打越有默契地避开整个行业的 [vip_content_start] “死亡线” ,以确保大家还有生意做。 反之,如果是正在上升的产业,价格时高时低是常态。君不见,小米手机当初问世时,不但没有让苹果手机从此一蹶不振,反而是大大地普及手机。而一般人一旦接触了智能手机,就很难回去以前的款式,或者没有手机的生活方式。 而且一个产业的兴起,也会带动其他产业的发展。例如廉价航空就带动了旅游业、酒店业、餐饮业等等。智能手机也是带动了许多软件开发、网络安全、芯片研发等等。故此,可以大胆推论DeepSeek的问世,将会让人工智能更快速地进入我们的个人生活,我们更需要学会接受和学习它,而不是还停留在嘲笑DeepSeek无法回答一些中国政治敏感话题(两个题外话,因为 DeepSeek是开源,所以你可以自行安装来避开所谓的 “政治审查” ;再来就是纵使我们懂得中国的敏感政治话题,也不能让我们在许多学术表现上赢得了DeepSeek)。 我记得Chat GPT问世时,许多人对于人工智能 “会不会思考” 总是嗤之以鼻。不过,潜水艇不需要学会游泳,但却不妨碍它取代人类许多水中潜行活动。况且,人类到底是怎么学会思考,还是一个未解之谜。至少许多人来说,他们根本也不知道自己是怎么学会的。不过,要是人类和机器所提供的反馈是高度相似,人类就很难却争辩谁才是 “有智慧” 的。 DeepSeek的问世绝对是一件好事,就让我们继续拥抱这些科技,并运用来让我们的生活变得更美好!
2天前
3天前
5天前
5天前
5天前
6天前