
新闻资讯
News and information
-
25
04/02
个性化软件:程序员的解绑?
为何说大语言模型将重塑开发逻辑?软件开发正经历着深刻变革,但情况跟大多数预测不一样。虽头条叫嚣“编程已死”,但真相更为微妙:我们正见证“个性化软件”的崛起——用户与创作者的界限逐渐消融。这一切都是由大语言模型与AI辅助开发工具的进步所驱动的。当前最令我兴奋的AI趋势是个性化应用。现在,任何人都能创建满足特定需求的应用而无需开发者或设计师的参与。作为产品设计工作室创始人,我需要担忧吗?完全不必。大家开发的应用越多,越能体会优秀软件背后的匠心。——ShaneLevine这场变革跟取代程序员无关,关乎的是软件创作的开疆拓土,特别是那些过去因过于个性化或小众而无法落地的应用。故事的主旨并非AI替代人类开发者,而是AI工具如何催生前所未有的软件新物种。审视当前开发版图:传统软件公司专注满足广泛市场需求,忽视海量的小众场景。这些空白不只是待开发的功能,而是一整个因过度专业化而美化商品化的软件类别。但AI辅助开发的兴起正在改写规则。当人们通过自然对话描述需求即可生成可用代码时,个性化软件开发的经济性蔚然改观。这不是要打造下一个Photoshop或Figma,而是赋能个体为独特工作流、爱好与难题创造专属工具。我本人就毫无技术背景(从未编码),但通过Replit平台与AI对话,我用手机开发出了追踪“狗狗吃了没有”的网页应用。——a16z风投机构JustineMoore个性化软件与传统应用开发有着本质差异。前者涉足的是一个在特殊约束下的新领域:无需支持百万用户、无需处理开发者需求以外的边缘案例,也不需要保持版本的兼容性。当软件开发所需时间与专业知识断崖式下降,项目的最小可行市场规模趋近于1。这不仅是量变,更是对“可市场化软件产品”定义的质变。正是这种简化场景,让AI辅助开发在这个领域大显身手。对某领域认知越浅,越容易对AI的输出惊艳——此谓“能力幻觉”。——GerardSans资深开发者对AI取代程序员的质疑确有道理:开发维护大型软件系统仍需当前的AI所缺乏的深厚技术知识、架构理解与经验。但此类怀疑往往会导致我们忽视个性化软件开发领域的真实变革。不妨这么想,就像电子表格赋能非程序员完成复杂计算与数据分析一样,AI开发工具正让非程序员创建个性化软件解决方案。关键区别在于:电子表格提供的是受限环境,仅针对特定问题,而AI开发打开了为个体需求定制完整应用的可能性。这一转变对软件行业影响深远。我们正从“购买所需”迈向“生成所需”。当个体能自主创建解决方案而非等待商业软件响应需求时,软件市场的总潜在规模将爆发式增长。这不仅关乎抢占现有市场份额,更重要的是重新定义了软件市场的构成。传统模式下,软件开发如同工业制造:高固定成本需庞大市场支撑。新模式则类似手工作坊,能为任意规模市场(直至个体用户)打造工具。对软件市场的衡量标准亦随之改变。随着更多的软件开发针对的是个人使用而非商业分发,许可证销售或订阅收入等传统指标可能也会失效。我们或需采用新指标,比方说节省的时间或解决问题的数量,来捕捉个性化软件创造的价值。但需注意一点:AI辅助做出来的个性化软件可能在健壮性、安全性与可维护性方面比不上专业开发应用。必须理解这些局限性,并认识到这并非专业开发的替代品,而是具备独特优劣势的新物种。个性化软件的涌现引发对开发职业未来的思考。它非但不会削弱专业开发者角色,反而可能推动领域向更抽象与更复杂进化。随着基础开发门槛降低,专业人士会更专注于技术专长仍十分关键的领域:可扩展性、安全性、性能优化与复杂系统集成。软件工程史可看作是不断抽象化的过程。就像编译器发明并未消除程序化思维的需求,而是将工作提升至更高抽象层级,AI助手亦代表着此进程迈向了下一站。关键区别在于:用户无需学习正式的编程语言,只需掌握如何通过自然语言精确表达计算意图即可生成可用代码。AI并未消灭编程,而是为“指示计算机执行特定任务”这一底层过程提供了新的抽象接口。越来越多零编码经验者通过lovable_dev等平台创建应用。这对开发者其实是个利好:用户终将触及工具极限,转而寻求专业解决方案。本欲取代开发者的技术,反而可能创造出更多的机遇。——JulienAI辅助开发的悖论在于:它可能为专业开发者创造更多机会。当用户通过无代码平台与AI助手入门后,终将触碰到工具的能力边界。就像建站工具通过赋能中小企业反而扩大了专业网页开发市场一样,AI开发工具或将培养出理解定制软件价值的新一代具备技术素养的客户。展望未来,包括AI生成代码共享市场、应用定制扩展工具,以及专为AI辅助开发设计的新框架在内,围绕个性化软件开发的新平台与社区将崛起。软件开发的真正革命不在AI取代程序员,而在于AI创造出一个前所未有的软件开发新类别。这一转变或将孕育出更丰富多元的生态体系——商业应用与长尾个性化解决方案共存共生。在此转型的过程中需维持一个平衡的视角:个性化软件的崛起并不预示着传统开发的终结,正如电子表格并未终结金融软件一样。它代表的是软件创作可能性的拓展,在开辟新机遇的同时,保留专业开发的核心价值。软件开发的未来并不是有你没我,而是兼容并蓄。专业开发者会继续开发复杂系统,AI工具则赋能个体实现曾不可及的个性化方案。这有望令软件前所未有地更加触手可及、更加个性鲜明、更加深度地融入生活之中。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
04/02
苹果重拾“AI医生”
苹果的AI医生为何来迟?3月30日彭博社爆料,苹果大改其健康App,意欲开发一个全新的“AI医生”。据悉,该计划为代号ProjectMulberry,现阶段包含AI健康教练、食物追踪、锻炼分析、教育内容四大模块,尝试利用iPhone作为媒介,向用户提供一个算法构成的虚拟医生。ProjectMulberry的四个健康模块如果用户同意应用的条款,苹果将会收集用户日常生活产生的各类健康数据,并交予AI医生进行分析,进而为用户定制个性化的健康管理计划。同时,苹果还会与睡眠、营养、物理治疗、心理、心脏等方面的医生共创科教视频。这些内容将作为AI医生的补充,向用户直观地描述他们的健康信息,或是解释健康计划的制定逻辑。举个例子,当苹果的App收集到反映心率异常的数据,AI医生便会在给予用户提醒的同时,推送一些解释心脏病风险的视频,敦促患者及时进行干预。不过,早在深度学习萌芽时,谷歌、微软、IBM等巨头便沿着自己的理念推出过各具特色AI医生,但其中的绝大多数已经折戟,少有企业再提“AI医生”。而今已是大语言模型时代,苹果的医生似乎有些姗姗来迟。01苹果的AI医生为何来迟?单单从ProjectMulberry的内容来看,苹果此次爆出的四个模块没有太多吸睛之处。AI健康教练、视频教育不是什么新鲜概念,食物追踪、锻炼分析等基于计算机视觉的应用也早有国内外厂商试水。但对于苹果而言,当下可能是属于它最好的时机。众所周知,苹果的生成式AI能力一直落后于GAFA中的其他成员。当Gemini和GPT在AI逻辑推理上打得不可开交时,对话式Siri仅仅交出测试成功率66%~80%的答卷。由于每三次交互中便会出现一次错误响应,原本2024年的上线计划被直接推到了2027年。为了追回颓势,苹果2月宣布了5000亿美元本土投资计划,打响翻身战。计划之中,苹果将在未来四年重点发展AI服务器制造、研发扩张等产业,强化云计算、AI推理、数据分析能力,预计在2025WWDC大会上推出自研AI系统,整合语音、视觉与多模态交互。因此,在当下这个节点上爆出新计划,要么是“AI医生”的想法已在苹果健康生态构想中孕育多年,要么由于库克对于健康产业的钟爱,ProjectMulberry赶上了自家的AI风口。其次,国内外企业虽在“AI医生”早早开启布局,但由于算法的局限及数据的缺失,很多企业开发应用效果都不尽如人意,未能走到市场中。举一个例子:过去很多医生都提到了这样一个需求,他们希望AI厂商开发一个智能算法,尽可能准确地识别图片中各个食物的热量,以此给予用户直观的计算结果,达到热量摄入控制的效果。在那个没有生成式AI的时代,AI厂商只能通过深度学习去进行食物的分割,基于食物加工后热量的平均值进行估算。但因为食物种类多元、加工方法各异,当时的AI无论在食物要素的分割,还是热量的估算上,都与现实存在较大的误差。苹果选择此刻切入这一赛道,其中的重要原因便是因为相关的AI技术已经趋于成熟。如今,iPhone16已能较为准确地估算食物的卡路里和碳水化合物含量,帮助肥胖症、糖尿病等疾病患者进行健康管理,加之生成式AI的赋能,新一代的“食物跟踪”大概率能将分割与计算做得更精准,达到医用的标准。同理,锻炼分析亦能借助新的AI技术实现突破。基于iPhone的后置摄像头,AI医生能够取得更为丰富的数据研究用户的锻炼情况,提供相应的动作纠正和姿势纠正,实现“数字物理治疗师”功能。总的来说,本有的AI基础制造投资计划叠加常年积累的AI视觉能力,苹果有望将围绕这些陈旧的概念做出新一代的数智应用。何况,有可穿戴设备这一生态优势作为支撑,苹果或许真能盘活AI医生,使其规模性地落地市场。02越过数字医疗难以逾越的阻碍从ProjectMulberry现有的内容看,苹果AI医生期望切入的领域可能是“AI+健康管理”,也可能是“AI+数字疗法”。近几年间风云变幻,两个赛道中的不少初创公司已经无功而返。追其究竟,相关企业由于缺乏数据难以给出精准的个性化诊疗计划,因而服务产生的价值未能覆盖研发推广过程付出的高额成本。得益于可穿戴设备生态赋予的多模态数据集成能力,苹果首先能够解决“精准性”与“个性化”带来的问题。2014年,初代AppleWatch便已集成心率传感器,能够连续手机用户的心率变化信息。2018年后,AppleWatch又引入了ECG功能,使其能够在后台动态检测用户的心脏节律。ECG可谓可穿戴设备在医疗健康功能上的第一个“杀手级”功能,让真正需要持续体征监控的带病人群也能从技术的发展中受益,从而打开了慢病人群这一巨大的市场。2021年,苹果的单导联ECG和房颤提醒两个功能以“突破性创新医疗器械”的形式获得了FDA的器械审批,使其成为全球第一款直接面向消费者的通过手腕检测心电图的非处方产品,实现了AppleWatch消费级到医疗级的跨越。2020年9月,新发布的AppleWatchSeries6又加入了血氧监测功能。结合心率变异性(HRV)分析,苹果可生成深度睡眠质量报告,揭示用户夜间呼吸与心血管状态的关联,为慢性疲劳、睡眠障碍等亚健康状态提供了早期预警窗口。血糖监测方面,苹果此前和RockleyPhotonics合作开发硅光子技术,旨在通过激光光谱分析实现无创血糖监测。尽管在2021年双方分道扬镳,但苹果在微型传感器、光学算法上的积累,正加速这一重要项目的落地。若成功,AppleWatch将首次实现血糖、血压、心电图等代谢与心血管指标的闭环监测,颠覆慢病管理的已有范式。多模态数据融合之下,苹果已为用户绘制出一幅完整的健康画像。基于连续的、多维的数据进行辅助决策,AI医生理论上能够制定精准的健康计划,并根据用户身体变化进行动态调整。苹果健康生态中各类软硬件设备的作用其次,“AI健康管理”和“AI数字疗法”中的许多企业长期面临高昂的运营费用,他们必须在研发、获客、医生服务等方面投入大量成本。而在ProjectMulberry披露的内容模块中,大部分服务仅需要内部开发即可,仅有视频相关内容需要需求医生的支持。此外,苹果本身就具备拥有庞大用户的平台,因此能够省下了大量前期成本,使得凭借较低的客单价也能盈利。最后是商业模式。初创公司的绝大多数收入需要依靠提供服务获取,而苹果可选择的商业模式更为丰富。譬如,AI医生一方面可以软件的形式,随Health+纳入AppleOne套餐,抽成30%的医疗订阅费;另一方面可单单作为成本项,通过与苹果生态的强绑定,拉升苹果旗下其他可穿戴设备的销量。三大优势之下,苹果或能凭借AI医生开拓过去初创公司未能跑通的市场,在新的千亿院外健康市场中掘金。03重新审视那些被抛弃的医疗AI场景虽说现有的AI技术距离打通严肃医疗还有一段距离,但纵观当下AI企业的应用开发趋势、国家药监局审评审批改革路径、普通百姓对于AI技术极快的接受程度,我们可以清晰预见那个将AI作为私人医生的时代。而一向谨慎的苹果开启布局,或许意味着这个赛道已经存在跑通的可能。当然,发生根本性变化的不止“AI医生”。这个时候,我们有必要像苹果那样,重新审视十年AI发展间功亏一篑的智能应用。当技术的底座向前跃迁,那些被抛弃的医疗AI场景,或已拾得新生的可能。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
03/26
互联网大厂的AI APP大战:乱成一锅粥,谁都怕错过
三大派别决战AI新入口。就在上周,小红书旗下AI搜索APP「点点」不仅接入了DeepSeek,还正式宣布基于自研大模型上线「深度思考」功能,号称是学了超过10亿篇小红书笔记。与此同时,抖音APP测试接入豆包的消息也在上周悄然流出,从截图来看,豆包的入口甚至与点赞、评论直接并列,相当醒目。目的并不难猜,根本上还是为了打破豆包与海量抖音用户之间壁垒,减少用户使用豆包的体验成本。抖音Beta测试截图,图/Tech星球但应该不止我有这种感受:时至今日,各种AI的APP、APP的AI不是少了,而是太多了。且不提ChatGPT、DeepSeek、Kimi、智谱清言、讯飞星火等各种大模型的APP端,各大互联网公司也在结合自身平台的海量数据,推出了各种「更/最懂xxx的AI」,不仅小红书有「点点」,还有微博智搜、知乎直答、腾讯元宝等等。包括海外,马斯克的X也有GroxAI。实在有点用不过来。《红楼梦》里贾宝玉曾对林黛玉言:「任凭弱水三千,我只取一瓢饮。」但面对各种APP里的AI,恐怕用户想用都用不过来。而且不同平台的产品策略也有很大不同,知乎直答、微博智搜都是直接集成在主APP之中,点点是在小红书之外推出独立的APP,Grox不仅集成在X的APP上,还有独立的APP。甚至在具体到集成后的入口,各家也有不同的思考和选择,唯一的共识可能就是几乎都额外接入了DeepSeek。互联网公司只要训练AI、打造APP就可以,但面对市面上已经非常多的通用类、垂直类AIAPP,用户要考虑的事情就很多了。从APP船票到AI入口,谁都害怕错过既然AIAPP已经多到让人用不过来,那我们不禁要问:这些互联网公司为什么还在一窝蜂地做AI?答案其实很简单,因为谁都不敢缺席,谁都希望AI能成为自己的下一张王牌。就像10年前大家都想做自己的社交网络、5年前每家公司都在卷短视频,现在,AI越来越有可能成为一个吞噬一切的「超级入口」。图/DeepSeek谁的AI能吸引更多用户,自然就意味着流量、规模、市场——未来。互联网公司们自然很在乎,毕竟在这场从APP时代向AI时代过渡的竞赛中,谁也不能掉队,谁都不想认输。不过,尽管目标都是在AI时代继续伟大,但各家互联网公司的AI策略却明显不太一样。而对用户来说,更关心的问题可能是AI进入APP之后能带来的独特价值,而不只是接入大家都已经接入的DeepSeek。1、大模型派:AI即APP,APP即AI。ChatGPT、DeepSeek、Kimi、智谱清言、讯飞星火……这一类大模型玩家的玩法最纯粹:直接推出独立AIAPP,试图让用户把AI当作一个全新的生产力工具,而不是APP里的附加功能。但这条路显然并不容易。「AI即APP」最大的挑战在于用户习惯的改变——毕竟,不是每个人都愿意为一个个AI单独下载一个又一个的APP,甚至更习惯在已有的APP里顺手调用AI。图/雷科技OpenAI在这方面还是最领先的,ChatGPTAPP拥有全球最多的用户基数,DeepSeek、Kimi们也都在紧追不舍,尤其是努力拓展用户规模。2、垂直平台派:让AI成为APP的一部分。相比大模型公司,知乎、微博等平台的选择更加务实——它们没有推出独立的AIAPP,而是直接把AI整合进主APP里。甚至包括小红书,之前也是在小红书APP中上线了「达芬奇」「搜搜薯」等实验性的AI功能。相比单独推出一个APP会遇到获客难的问题,这种策略的好处对中小平台的优势非常明显,既避免单独培养AIAPP的用户群体所带来的冷启动风险,也在最大限度降低用户使用门槛,让AI融入已有的用户习惯。比如说知乎直答、微博智搜直接集成到主APP,用户无需额外下载就能使用。在微博APP,直接就把微博智搜的入口设置在搜索框中,点击就能跳转到「微博智搜」的独立界面。微博截图,图/雷科技但问题在于,这种方式很难让AI形成独立的品牌心智,用户可能并不会记住「知乎直答」或「微博智搜」这个名字,而只会认为这只是APP里的一个普通功能。这或许也是小红书几次尝试过后,最终选择独立推出「点点」AI搜索APP的关键原因。3、超级巨头派:独立App与集成AI双管齐下相比大模型创业公司,腾讯、字节、百度这类互联网巨头有大得多的资源,也有多得多的打法,既能从头开发一款AI原生APP,也可以通过旗下的超级/头部应用导流,比如腾讯元宝就直接拿到了微信的推广位。当然,也包括将AI集成到已有的超级APP之中。这也是字节正在采取的策略,在借助旗下各大渠道的流量推广,成为2024年中国第一大AIAPP之后,面对DeepSeek的异军突起,豆包终于也要接入短视频超级APP——抖音之中。而且入口层级非常高,测试显示了两个入口:一个直接出现在短视频播放界面,与点赞、评论并列;一个是出现在消息列表,更加无缝。这两个入口,也能让用户不知不觉就用上了豆包AI。马斯克的GroxAI也是类似的模式,不仅推出了独立APP,还将其直接集成在了X(原Twitter)APP的底栏,还有自己的独立APP,希望能同时抓住两类用户。这种策略相对稳妥,既能利用主APP的流量优势推广AI,又能在独立AIAPP方向上留下后手,但也意味着更高的投入成本。另外值得一提的是,根据官方运营人员的回复,「点点」AI搜索之后也会集成在小红书APP之中,但入口尚未可知。小红书截图,图/雷科技替代还是互补?一场AI时代的「入口」之争毋庸置疑,AI的快速进化正在挑战APP作为主要信息和交互入口的地位。未来,AI会完全替代APP,还是AI只是APP的一部分?从理论上来说,AI是有可能替代一部分传统APP的,尤其是那些以信息检索和内容消费为主的应用。试想一个场景,你原本需要打开百度搜索一篇攻略,但AI直接汇总了10篇优质内容,精准给出结论;原本需要在知乎、微博翻阅讨论,但AI已经帮你提炼出了核心观点……当AI能直接完成任务,用户自然不再需要跳转多个APP——这意味着,许多APP可能会被AI消解掉,或者说「降级」成AI的数据来源,而不再是用户主动访问的目的地。在腾讯元宝使用DeepSeekR1,图/雷科技但这并不意味着APP会消失。相反,AI也需要APP,或者说,AI需要一个「承载体」。毕竟,AI本身只是个「能力」,而用户习惯是很难改变的。就像当年移动互联网崛起时,许多人以为微信会干掉所有APP,但实际上,微信只是成为了「超级入口」,大量APP仍然依赖它来获取流量。同理,AI可能不会取代所有APP,而是成为一个新的信息分发和交互方式,让APP变得更加智能。换句话说,未来AI与APP的关系,更可能是「融合」而非「取代」。写在最后当前AIAPP乱战的局面,像极了2008年AppStore诞生后最初几年,大家都在争抢新的用户习惯和流量入口。而这场战争的最终赢家,可能不会是单一的AI,也不会是单一的APP,而是那些真正能让用户「无缝使用AI」的产品。而对用户来说,更重要的一个命题是我们是否真的需要那么多AI?或者说,未来的AI是否能真正让用户「更省心」而不是「更焦虑」?互联网公司们或许可以继续往前跑,但普通用户真正的需求可能没那么复杂——我们不需要100个AI,我们只需要一两个真正好用的AI。而目前来看,这场AIAPP之战,还远未到盖棺定论的时候。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
03/26
微信聊天框内置元宝,超级 App 又一轮进化开始
AI技术正在从独立功能向基础设施转变。微信终于在聊天框放了个AI助手。虽然名称上还是「元宝红包封面助手」,但在介绍里可以看到其是依托于腾讯混元大模型的AI服务,可以提供陪聊、答题、作图以及定制红包封面等功能。微信作为国内最大的社交平台,这次内置AI助手元宝或许意味着AI技术正在从独立功能向基础设施转变,腾讯正在将微信的生态优势转化到AI领域。这会是腾讯重回AI牌桌的绝杀开端吗?图片来源:极客公园01实测,用AI更丝滑了极客公园做了一番简单实测。先是问了一下它和元宝app的异同有哪些:图片来源:极客公园然后我丢入一篇极客公园昨天发布的公众号文章链接,内容是关于DeepSeek发布V3模型更新,「元宝红包封面助手」回复说「收到,我问问元宝~」,这个回复有点人性化的。随后它也没问我是否需要开启深度思考,就直接进行了21秒的深度思考:元宝的深度思考过程|图片来源:极客公园然后给出了我一份分析:DeepSeek公司于2024年3月24日发布了V3模型的重要更新,该版本虽非预期的V4或R2迭代,但在性能表现和开源政策上实现了显著突破。以下是本次更新的核心要点:技术规格与发布信息模型参数规模达6850亿,属于小版本升级(V3-0324)基于全新32KGPU集群进行后训练优化已通过官网、App及小程序等多渠道开放使用开源版本同步上线,延续初代V3「557.6万美元成本比肩Claude3.5」的高性价比特性核心能力提升前端开发能力接近Claude3.7专家级水平,用户测试显示:能生成包含CSS动画与JavaScript交互的完整HTML文件(如天气卡片动态效果)代码质量显著优于旧版R1模型(对比案例显示视觉效果与功能实现差距明显)在网站搭建测试中生成效果与Claude3.7Sonnet相当支持复杂指令解析(如通过函数/按钮组实现多天气动画切换)上下文理解能力提升,尤其在多轮对话场景可精准处理跨语言混合编程需求(示例未展示但文中暗示)开源生态建设采用更宽松的开源协议,降低商业应用限制延续初代V3作为首个冲入ChatbotArena榜单前十开源模型的优势发布1小时内即吸引全球开发者参与测试验证行业影响与用户反馈被专业用户评价为「相当于ClaudeSonnet3.5到3.6的升级幅度」在无官方基准测试情况下,用户实测数据成为主要验证依据开发者社区高度关注其开源协议调整带来的商业化可能性未来展望官方未透露V4/R2研发进展,但用户期待值持续升温当前版本已确立开源大模型领域新标杆,可能加剧行业竞争该更新标志着DeepSeek在保持成本优势的同时,通过技术迭代缩小了与顶尖闭源模型的差距,特别是在编程领域展现出颠覆性潜力,其开源策略调整或将重塑大模型生态格局。眼看清明节就要到了,我也问了问它「清明节做点什么好」,对这个问题它倒是没回复「收到,去问元宝」,也没开启深度思考模式,而是很快就输出了答案:清明节,作为中国传统节日之一,不仅是缅怀先人、寄托哀思的时刻,也是亲近自然、感受春天气息的好机会。以下是一些清明节期间可以进行的活动建议:祭扫祖先:前往祖坟或陵园,清扫墓地,献上鲜花、纸钱等,表达对逝去亲人的怀念和敬意。踏青赏春:利用清明假期,与家人朋友一同外出踏青,欣赏春天的美景,呼吸新鲜空气,放松心情。植树造林:参与植树活动,为大地增添一抹新绿,既是对自然的回馈,也是对生命的礼赞。品尝清明食品:制作或购买清明节特有的食品,如青团、清明果等,体验传统节日的风味。文化体验:参观博物馆、文化遗址,了解清明节的历史文化背景,增长知识。家庭聚会:利用假期与家人团聚,共叙亲情,享受家庭的温馨。静思冥想:在宁静的环境中,进行冥想或静思,反思生活,规划未来。公益活动:参与社区或慈善机构组织的公益活动,帮助需要帮助的人,传递正能量。户外运动:进行徒步、骑行、野餐等户外活动,锻炼身体,享受户外的乐趣。摄影创作:带上相机,捕捉春天的美丽瞬间,进行摄影创作,记录生活的美好。无论选择哪种方式,重要的是要用心感受节日的意义,珍惜与家人朋友相处的时光,同时也要注意安全和环保,让清明节成为一个有意义且愉快的假期。还有分析文件的功能我也试了一下,之前如果看到比较复杂的文件想让AI先帮忙概括总结一下要点再去细读的话,得先去打开AI产品或者去相应的网页,但现在可以直接在微信里丢给这个助手,使用体验更丝滑了一些。这次「元宝红包封面助手」也自行开启了深度思考模式:图片来源:极客公园在21秒的深度思考后,助手给出了出一份分析:对文档内容的技术分析与行业洞察一、语言模型技术演进核心突破:从N-gram到Transformer的范式转变,语言模型参数量级从百万级(GPT-1)跃升至万亿级(GPT-4)自监督学习(MLM/NSP)解决了海量数据标注难题,预训练+微调模式成为行业标准词嵌入维度从768(BERT)扩展到12888(GPT-3),语义表征能力呈指数级提升关键技术指标:训练数据量:GPT-3使用45TB数据(约1万亿词),相当于1351万本牛津词典算力成本:ChatGPT训练需1万张V100GPU,成本超10亿人民币模型效率:DeepSeek通过稀疏注意力等技术,将训练成本降低至同规模模型的1/3二、Transformer架构创新技术革命性:自注意力机制实现O(n²)的全局关联建模,相比RNN的序列依赖突破显著多头注意力层数从12层(BERT)增至96层(GPT-3),上下文窗口从512扩展到32K(Llama2)位置编码从绝对位置(Sinusoidal)发展到相对位置(RoPE),更好处理长序列工程实践突破:混合精度训练(FP16/FP32)节省40%显存消耗梯度检查点技术(GradientCheckpointing)实现百倍序列长度扩展张量并行+流水线并行将千亿参数模型训练效率提升80%三、DeepSeek的技术突破开源生态贡献:模型架构:提出动态稀疏注意力机制,推理速度较Llama提升2.3倍训练效率:MoE架构实现万亿参数模型在千卡集群上的可行训练中文优化:构建包含2.6万亿token的中英双语预训练语料库性能指标对比:数学推理:DeepSeek-Math-7B在GSM8K达到83.5%准确率(GPT-4为92%)代码生成:HumanEval得分68.9%(CodeLlama-34B为53.7%)多模态理解:ViT-22B在ImageNet-21K上top-1准确率达88.7%四、行业发展趋势技术前沿方向:多模态融合:GPT-4o实现200ms级跨模态响应延迟(人类平均反应时间250ms)推理能力突破:DeepSeek-V3在定理证明任务上达到IMO金牌选手水平能源效率:新型混合架构(如DeepSeek-R1)实现每瓦特算力提升5倍中美竞争格局:开源模型差距从12个月缩短至3个月(Llama3vsDeepSeek-v2)算力基建:中国在建智算中心规划算力达2000EFLOPS(美国当前运营1200EFLOPS)行业应用渗透率:中国制造业AI质检部署率达37%,超越美国29%五、关键数据启示经济学视角:大模型训练边际成本曲线:参数规模每提升10倍,单位token训练成本下降28%ROI周期:头部企业模型商业化回报周期从36个月缩短至18个月人才密度:顶尖AI研究员中美薪资差距从50%收窄至15%技术伦理考量:安全对齐:最新RLHF技术将有害输出概率从3.2%降至0.07%能耗优化:液冷集群PUE值从1.5优化至1.08,碳排放减少40%可解释性:因果归因算法实现85%的决策路径可视化注:文中涉及企业及技术参数均来自公开资料,分析基于技术演进规律推导,具体实施需结合行业动态调整。建议关注浙江大学CCAI中心官网获取最新研究成果。看来关于是否开启深度思考模式,「元宝红包封面助手」有自己的判断,如果任务很简单,就不开启,反之自动开启。02加速AI布局过去一个月,腾讯在AI应用领域加速布局。2月起,腾讯旗下多个核心产品,如微信、元宝、QQ浏览器、QQ音乐、ima(腾讯智能工作台)、腾讯文档、腾讯地图等,均接入了DeepSeek模型,并同步支持自研的混元大模型;元宝走向日更级迭代,35天版本更新30次;混元大模型推出腾讯首个自研推理模型混元深度思考模型Thinker(T1)、发布新一代快思考模型TurboS、推出5个全新3D生成模型并全部开源……业务线也作出整合,为了更好地发挥AI技术的协同效应,2月,腾讯将QQ浏览器、搜狗输入法、ima等十余款AI产品及团队从PCG(平台与内容事业群)划归CSIG(云与智慧产业事业群),形成以「元宝」为核心的「C端工具+B端服务」矩阵。在资金投入上,腾讯也展现了其在AI基础设施建设上的决心。在1月的2024年度员工大会上,马化腾提到腾讯会持续投入资源进行算力的储备。据报道,腾讯计划在2025年加大算力基础设施的投资,投资金额或达1000亿,其中计算约580亿(GPU约400亿、服务器约110亿、存储设备约55亿、网络设备将近58亿),IDC部分,自建及相关费用加起来将近131亿,租用部分将近要花200亿。3月19日,腾讯总裁刘炽平在财报后的电话会议上称,资本支出占收入的百分比将上升到十几个百分点,人工智能将成为战略投资的重点。微信这次将大模型产品「元宝」内嵌于聊天界面,看似是功能升级,实则是腾讯对AI时代的战略卡位。通过将大模型产品以「AI版文件传输助手」形态嵌入高频聊天场景,微信将用户的工作流、信息流统一收束,通过总结公众号文章、解析文件、图片等刚需功能,微信在原有的功能之外,新增了一个可以持续产生价值的AI助手角色,这可能会让用户在微信的停留时长和打开频次迎来结构性增长。微信作为国内最大的社交平台,这次内置AI助手元宝或许意味着中国互联网正式进入「AI原生应用」时代,AI技术正在从独立功能向基础设施转变。而随着开源日渐成为行业趋势,单纯的大模型技术能力越来越难以成为产品和市场竞争的绝对壁垒。当微信这样的庞大生态,带着海量用户接入AI功能,对于所有的AI创业者来说可能都要思考:到底什么样的功能和创新,可以让小公司与微信这样的生态竞争用户接触AI的入口;到底什么样的壁垒,才能不被现有的超级产品生态,以接入新功能的方式吞噬。DeepSeek重塑了AI行业的格局,技术公司、大厂和AI原生创业者,都要重新思考自己的生态位。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
03/26
企业管理软件的“AI革命”:是救命稻草,还是昙花一现?
不以用户为中心,任何技术升级都是在炫技,毫无价值可言。2025年随着deepseek的推出AI技术可以说是火得一塌糊涂,而各大企业软件行业也纷纷搭上了这趟快车。在短时间内纷纷官宣其接入了deepseek,更有甚者已经再宣传自身的AI能力了,但问题就是是,这些所谓的AI功能,到底是真能解决问题,还是只是为了蹭热度?老杨认为企业软件接入DeepSeek等AI技术,既有蹭热度的可能,也有真正为用户服务的动机,但问题是这种动机是否能真正的实现。其实行业人士都看的出大部分的管理软件公司在短时间内官宣接入DeepSeek都是在蹭热度,动机何在呢?第一,想通过蹭热度吸引用户关注,快速提升销量或估值;第二,看到竞争对手接入AI,担心落后,于是匆忙跟进;第三,技术能力不足,接口来凑,部分软件公司缺乏深度开发AI功能的能力,只能选择简单的接口调用这种方式来体现;老杨认为如此做法对于企业管理软件而言无疑是在“饮鸩止渴”,对于企业用户而言什么开发过程如何来实现是不懂,只关注结果,软件公司如此宣传导致的后果就是企业用户被宣传吸引,可能为这些所谓的“伪AI”功能支付额外费用,但实际使用后发现功能鸡肋,未能获得实际价值导致失望和信任流失。此时企业用户对软件产品的失望会转化为负面口碑,可能导致对整个行业的技术能力产生怀疑。作为企业管理软件应该知道的是AI是工具,不是目的。AI技术的价值在于解决实际问题,而不是作为营销噱头。企业管理软件在接入或开发AI功能时,应该以用户需求为核心,思考AI如何优化业务流程、提升效率或降低成本。深度整合是关键,简单的接口调用无法发挥AI的真正价值。其实道理谁都懂,只是逃脱不了市场的卷。企业管理软件加入AI接口或者开发AI功能本身是件好事,但问题是要以用户为中心,不能为了追潮流、为了AI而AI,AI卖点可以获取流量高曝光率,可以骗骗不懂技术的企业领导,但也会反噬。比如某软件公司宣称自己接入了AI,功能如何智能,结果用户发现,所谓的AI功能只是一个简单的关键词搜索工具而已,根本谈不上“智能”,反而还很“弱智”,结果很快就在圈子里“臭名远扬”。圈子里的人都知道AI功能的开发和应用是一个长期过程,需要持续投入资源进行优化和迭代。软件公司不能指望一蹴而就,企业软件加入AI功能,绝对不是简单地接入一个DeepSeek接口就能搞定的事情。AI的引入是一个系统工程,涉及技术、业务、用户体验、数据安全等多个层面的深度整合。如果只是简单地接入一个接口,不仅无法发挥AI的真正价值,还可能带来一系列问题。DeepSeek与AI技术当前很火,但应用了AI技术就真的能拯救企业管理软件吗?老杨认为AI技术确实有潜力为企业管理软件带来显著的价值,但它并不是万能药。要真正提升企业管理软件的竞争力,必须从用户需求、业务场景、技术整合、用户体验等多个维度综合考虑。企业软件加入AI功能可以在一定程度上提升企业用户的效率,比如分析大量数据,提供洞察和预测,帮助企业做出更科学的决策。但AI的效果取决于数据的质量和数量。如果企业管理软件的数据不完整或不准确,AI的输出结果也会大打折扣,但对于大部分传统企业领导而言是不懂这些的,他们不会在管理上做出变革,最终会认为是软件功能不行、是AI弱智。同时AI功能擅长处理结构化数据和明确规则的任务,但在复杂、模糊的业务场景中,仍然需要用户的经验和判断,所以有时候AI并不能解决管理者所有的痛。而最最关键的是AI不是“零成本”,开发真正实用的AI功能需要软件公司投入大量的成本,且AI技术更新换代很快,软件公司为此还需要承担技术风险,而这一切最终都需要企业用户来买单,并不是所有的企业能够承担的起高昂的产品费用。在企业软件热火朝天宣传AI、引进AI技术与其产品结合的同时,老杨认为很多软件公司比较容易忽视的一个关键问题就是:企业用户的能力。所以不管是在当前还是在以后软件公司都会面临如下问题:1.高质量的数据:如果企业原来的数据存在错误、不完整或者格式不统一等问题,那么即使软件具有了AI的功能,也可能无法得到准确的结果。就好比用一堆烂材料盖房子,再好的工匠也很难盖出坚固的房子。2.员工接受问题:在大部分员工眼里认为应用AI技术及功能就是为了淘汰,所以会抵触,这在一定程度上会影响工作效率和软件的推广使用。3.行业适配性:不同行业的企业管理需求差异很大,有些行业的业务流程非常特殊和复杂,现有的技术可能无法完全满足其个性化需求。比如,金融行业对风险控制和合规性要求极高,制造业对生产流程管理要求严格,这些特殊需求可能需要企业管理软件进行深度定制开发,而不仅仅是依靠通用的技术接口就能解决。但深度定制开发又涉及成本、流程与管理变革,最终又会进入无解的死循环里。所以从以上我们不难看出,AI技术为企业软件行业带来了新的机遇和挑战。但AI不是万能药,它的价值取决于企业如何应用。如果只是为了赶潮流,那AI充其量就是个“花瓶”;但如果能真正解决用户痛点,它就能成为企业软件的“核心竞争力”。面对市场竞争和经济环境的变化,企业软件需要深度整合AI技术,提升智能化、个性化和数据驱动能力,同时通过完善的服务体系为客户创造更大价值。只有那些真正以客户为中心、深耕技术和服务的企业,才能在AI浪潮中立于不败之地。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除
-
25
03/25
从互联网到AI,「大厂」跌落神坛
当前AI发展现状,缺少用户全生命周期价值的讨论。关于AI能否诞生出下一个超级应用的讨论,一直是行业里最热门的话题。这个话题的本质,是在现有技术框架下寻找最接近AGI的商业化形态。当前ChatGPT的1亿用户规模已接近超级应用门槛,但日均使用时长不足20分钟的现状,暴露了工具属性与粘性需求的矛盾,也折射出AI行业的集体困惑。市面上各类AI应用早已超2000款,从A16z等投资机构的分析来看,当前主流产品集中在AI陪伴、ChatBot、智能客服、图片视频生成等领域——当用户打开手机应用商店时,看到的仍是千篇一律的“AI助手”和“创作工具”,市场始终缺乏一款真正的国民级产品。这一现象的背后,是互联网与AI两波技术浪潮的根本性差异。超级应用的背后往往是超级大厂,但从全球范围来看,大部分AI初创企业熬不过五年生存期。以国内市场为例,据统计,过去三年里,累计超过20万家AI企业因各种原因退出市场,即使有的能在短时间内成为新晋独角兽,但一个鲜被关注的现象也同时浮现:尽管这些公司估值飙升、融资不断,但至今没有一家能被称为“大厂”。相比互联网时代,阿里用“平台+流量”征服电商,腾讯以“社交+内容”建立帝国,字节跳动靠“算法+推荐”重构信息分发——标准化产品、网络效应、边际成本趋零的黄金三角,支撑起超级公司的诞生。而AI时代的技术逻辑正在颠覆这一切:模型训练成本与场景复杂度正相关、技术复用率低、数据价值呈长尾分布。组织基因的冲突更为尖锐。某大厂AI实验室采取“赛马机制”,多个团队产出的同质化客服系统,最终因无法适配客户私有化部署全部夭折。这种“大中台”模式在AI领域的水土不服,折射出更深层的矛盾:当技术价值从通用性转向场景特异性,传统的中心化组织架构与AI所需的敏捷响应机制产生根本性冲突。当我们将视角拉远,会发现这场产业变局的三个核心矛盾:产品逻辑从“用户连接”转向“场景渗透”、组织架构从中心化转向“细胞化”、技术估值体系从“规模溢价”转向“场景乘数”。这些差异在冥冥之中,或许注定了AI时代难以复刻互联网的造神神话。当前的AI公司,还没有真正意义上的“大厂”“大厂”一词诞生于互联网时代,核心特征是庞大的员工规模与生态化布局。以腾讯为例,成立五年时总员工数量达到2000,截止目前人数已经超过11万人;字节跳动更是以年均万人规模的增速,十年内就达到12万员工的体量。传统互联网大厂通过“产品矩阵+流量生态”模式,将用户、数据、服务深度绑定,形成自我循环的商业闭环,同时也带来了大量的就业岗位。就拿电商行业来说,在供给、支付、物流、信用体系加持下,成就了万亿级标准化市场,如今最有代表性的阿里,员工总数已经逼近20万。某种程度上,人数、岗位的增长,能够反映出一家互联网公司的市场规模和业务进展的成熟程度。但纵观AI领域,目前国内外大部分的玩家,仍以小于千人的创业团队为主,明星公司如DeepSeek,目前的总人数仅为160人。即使是OpenAI,成立近十年,员工总数也只有2000左右,其中近90%为技术人员,业务仍集中于模型训练与垂直场景应用,远低于传统互联网大厂的人口增速。AI公司的“技术密集型”结构,与互联网时代的“人力密集型”模式形成鲜明对比,某种程度上,意味着行业尚未形成可复制的规模化增长路径。前段时间,有媒体称,当下AI领域高薪招人成了普遍现象,近一年AI技术岗位中,30%的年薪超过50万元。类比早年传统互联网行业的繁荣,诞生了一批以程序员为代表的城市中产,于是有人推断,AI也在催生这样的盛况。但现实中准确的来说,这场AI领域的高薪招聘热潮,仍然是由互联网大厂主导。阿里2025年春招开放的3000个实习生岗位中,近50%与AI相关。字节除了广挖行业专家,张一鸣甚至亲自牵头挖掘各路人才。众所周知,在最早一批的AI抢跑过程中,大厂几乎落后了一拍,在技术、产品、商业模式上都没能主动带来先发性的突破。随着大厂补齐短板,创业公司当中,有技术实力的陆续被兼并,有价值的业务、技术和人才最终又回流到了互联网大厂。后者有资源、有足够的现金流来支持长期的研究,并能够在产品侧同质化极其严重的情况下,凭借综合优势后来居上。但需要注意的是,这并不意味着互联网大厂变成了“AI大厂”,事实上,AI仍只是他们生态内的一个组成部分,负责这部分业务的团队,大多是在原有基础上,进行扩充或将队伍拆分的更加细致。作为对比,不同于互联网公司的大跃进式招聘,那些一开始走向行业潮头的新兴公司,反而显示出不断缩编的迹象。自去年开始,包括MiniMax、月之暗面、零一万物、智谱在内的AI公司接连传出裁员消息,当年从大厂出走的技术骨干也陆续出现回流迹象。倒闭8万家新公司从哪来,到哪去?来看一组数据。自ChatGPT发布到去年8月,国内有近8万家新注册的AI公司处于注销、吊销或停业异常状态,占同期新注册AI企业总量的约9%,也就意味着,由大模型掀起的AI浪潮下,不到三年里兴起的创业公司接近90万家。这些企业从哪来?ChatGPT通过大模型+人类反馈强化学习的技术路径,实现了自然语言处理的质变,两个月内用户破亿的商业成功,为国内企业提供了可复制的技术路线参考。资本市场将ChatGPT视为“AI的iPhone时刻”,当年A股市场单月概念股涨幅过半,融资额同比激增数倍。这种财富效应一度点燃了三类玩家:互联网巨头通过发布“中国版ChatGPT”抢占舆论制高点;传统科技企业加速向AI转型;初创公司纷纷快速成立。有投资人指出,国内资本的投资偏好,使得轻资产、易包装的初创公司更容易获得融资。另一方面,伴随AI被地方列为重点产业并抢滩布局,给出了前所未有的扶持力度,像北京、上海的AI园区提供免费算力、税收减免,甚至直接给企业“发钱”。当技术、资本和政策的红利同时出现时,市场往往会陷入虚假繁荣。如果将行业泡沫归咎于垃圾公司的短期风口套现,那么活下来的优质企业中,又是什么限制了他们的进一步生长?对于这个问题,最容易想到的原因是“缺人”。此前有研究人员表示,国内AI人才总缺口数百万,一些一线城市的人才需求与当地高校之间存在相差十倍的缺口。今年各家公司春招甚至都开出了百万年薪招揽毕业生,这些岗位大多为算法工程师、数据科学家、模型架构师等核心技术岗,还有一些与AI相关的业务岗,如AI产品经理、AI硬件工程师等。然而,据行业资深从业者透露,当前AI领域的人才争夺战呈现明显的“战略囤积”特征——企业意识到人才是核心资源储备。现实情况中,大部分的AI企业存在“人才到位但效能滞后”的人才空转现象,技术团队与业务部门的协同效率不足,导致人均产出甚至要低于互联网企业。外界对此的解读分为两方面。一是企业未能建立起与AI技术相匹配的组织架构和业务闭环,以阿里的电商业务为例,内部并不是所有人都是代码专家或市场精英,还有大量分布在供应链管理、客户运营、风险控制的支撑性岗位,起到维持商业模式运转的作用。相比互联网紧密连接商业世界,能跨越时空解决问题,对实体商业冲击巨大,改变了人们的生活和消费方式。AI在某种程度上是与商业世界脱钩的,除了优化部分工作流,在实际应用中的程度相当有限。“衡量一款产品成功与否,一定要看它在用户全生命周期上发挥的价值,但AI还远未达到这一要求。”业内人士分析,根本原因一方面在于商业化的路径不清晰,另一方面在于技术本身的局限性,远没有互联网那么大的影响力。另一个观点则认为,当下的AI,或许还并不需要那么多的人。人们对AGI的期待,本质是希望AI能突破单一任务限制,具备人类级别的跨领域推理能力。这种愿景推动了大模型技术的爆发式发展。行业追逐的“超级应用”,以及所谓的“大厂”和相关产业链路,是在现有技术框架下寻找最接近AGI的商业化形态。但当前技术仍处于“弱AI”阶段,大模型存在幻觉、逻辑推理缺陷等问题,距离真正的AGI仍有鸿沟。意味着,AI还要经历漫长的技术验证,才有可能跳出高度聚焦于模型训练或单一场景应用的业务,这一时期,AI呈现出的本质是"智力密度"的比拼,而非互联网赛道人力规模的较量。更深层的挑战,在于AI创业公司后期经营过程中的组织缺陷。尤其是国内企业,普遍存在“研究”与“研发”的认知错位,在高层领导与投资人的push下,科研团队的时间精力,往往被迫用来应付短期的KPI,而非真正的前沿探索。这种现象在高频考核体系下尤为突出,算法团队不得不用有限资源追求更具性价比的短期效果,导致技术迭代陷入“内卷式优化”。因此也就不难理解,DeepSeek创始人梁文锋多次婉拒腾讯、阿里等大公司投资,将量化基金收益全部投入AI研发,在他看来,比起盲目去扩张团队,当AGI实现路径仍不明朗时,与其做垂类和应用寻求变现,更明智的选择是找到真正合适的人才继续深入研究。AI需不需要再造大厂?AI这个概念自诞生之初,最大的想象力来源于对人的替代上。前段时间的Manus就是典型的例子,作为一款通用型Agent产品,上线首周便经历从狂热追捧到舆论反转的一波三折,它的突破性体现在产品形态的创新,能够接管日常的一部分实际工作,这让人们似乎看到了AGI的一些缩影。但在技术专家看来,Manus的底层技术并不复杂,如果市面上同时上线了多款类似的产品,用户怎么选择,将最大限度取决于大模型的精准性,即对人工的真实替代程度。对于企业来说,AI的价值同样体现在“人工替代”,并一度作为企业降本增效的不二法则。就连一些AI公司也已经将数据标注的工作交给Agent工具,这揭示了AI时代的人才配置逻辑:关键岗位需要顶尖专家,基础岗位应通过技术替代实现人力优化。回到核心话题,AI究竟需不需要大厂?这个问题其实是在讨论,AI公司究竟要不要成为腾讯、阿里那样树大根深且涉猎纵深的巨型企业,以及有没有可能孵化出类似微信、淘宝这样的超级应用。AI技术的落地高度依赖数据、算力和人才,阿里、腾讯、字节等凭借长期积累的海量数据、强大的算力基础设施以及顶尖人才团队,在模型训练和场景落地中占据优势。在这一背景下,创业公司往往因资源受限难以直面竞争,但部分专注于细分场景的中小公司,可以提供各种垂类应用,通过单点突破实现商业化。大厂的优势不仅在于技术,更在于业务生态的协同性,腾讯依托微信生态推动商业化发展,阿里通过电商场景优化推荐算法,然而AI产品却呈现出与以往互联网截然不同的发展路径,用户规模红利体现得不明显。当互联网大厂将电商、教育等业务线的精兵强将调往AI部门时,会发现这些互联网时代的战斗单元在AI战场水土不服。传统业务部门习惯的“数据驱动决策”与AI团队的“模型迭代思维”存在本质冲突,前者依赖用户行为数据优化体验,后者需要高质量标注数据训练模型。拿字节CEO梁汝波今年全员会上的描述来说,豆包没显出“越多人用越好用”的互联网产品特性。相比互联网产品依靠用户数据进行优化,当下AI产品大多以生成类工具为主,用户提问数据对于模型优化的好处十分有限。一款拥有几亿甚至几十亿MAU的AI产品,商业价值或许远不如微信;而一家出色的AI企业,也并不意味着一定会成为阿里、腾讯那样的规模大厂。根本的原因,和上一轮互联网浪潮相比,用户规模的增长往往能带来显著的经济效益,这一轮AI浪潮最鲜明的特征是,尽管有大量资本投入,但还未找到稳定的盈利模式,并且呈现出“C端起量,B端买单”的局面。在2025年的AI产业图谱中,技术纵深正在取代用户规模成为核心竞争力。微软研究院的研究表明,具备跨领域推理能力的AI系统,其价值创造效率将呈现非线性增长。但实现这一目标需要的不是用户规模,而是高质量的多模态数据和持续的算法创新。换句话说,当技术走过验证期后,AI或许才能开始讨论用户全生命周期的话题。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除!
-
25
03/10
记账App都这么多了,为啥还有程序员想写?
真别卷了最近世超发现一个现象。就是问大家点外卖、听歌用什么App,答案往往就在那几个里面选。可一旦问到“记账用什么App”,世超敢打赌,不一样的回答会超过10种。有人会说钱迹,有人会说鲨鱼记账,可能也有人会说iCost、Cookie等等。之所以会出现这样的情况,原因并不难猜——一是市面上记账App实在是太多了,请看图简单感受下。。。图源七麦。二呢,这么多App还没出现一家或两家独大的情况。去年有人在v2ex发了个帖子,让大伙儿推荐一款记账软件。结果世超在53条评论里,看到了13款记账App的名字。类似的情况,也出现在三年前的一个帖子里。看到这也许有差友会问,为啥市面上会有这么多记账软件?一句话概括就是:记账软件是独立开发者的helloworld。只要在互联网上稍微搜索下,你就会发现很多记账软件,其实并不是由一家公司从0做到1的。比如钱迹的作者就是一个叫李唐的程序员,他在北京找工作的那段时间,给自己写了一个记账App。后来找到工作后,就用业余时间开发和维护。最后又辞职,全职开发钱迹。比如Cush记账,是由一个叫Shasha的开发者和小伙伴一起制作的。还有Cookie,也是由一个叫wanbo的独立开发者维护。那为什么程序员做独立开发者,要选择做记账App呢?最主要的原因,还是记账的市场太大了。首先,记账有着天然的需求。它可以让你清楚财务状况,培养理财规划。什么钱该花什么钱不该花,心里都有数。其次,我们这些年金钱出入的方式越来越复杂了。像付钱方式,除了支付宝和微信,很多平台也能直接从银行卡扣钱。除了付款,我们还会遇到转账,抢红包,取现,报销等各种情况。这种情况下,支付宝、微信或者某一手机系统的自动记账功能,就很难满足我们的记账需求。所以越来越多人开始下载专门的记账App。根据易观千帆2020年整理的数据,记账理财应用的活跃用户在2700万到3000万之间徘徊。也许你会说需求大的应用多了去,这些开发者为啥就盯着一个记账呢?世超问了一个10年大厂程序员Z,他没有一点犹豫,回复了四个字——容易开发。Z说如果他做一个记账App,几天就能出一个demo。要在iOS平台开发,那更省事,App可以直接借助苹果的同步功能实现数据同步,不需要自己额外搞后台服务。这点世超也认可。因为做起来简单,大公司的技术优势就没有了,你请一支团队能做出来,请一个人也能做出来。所以程序员们跑到这条赛道上,不怕和大公司竞争。简单是其一,其二是变现手段成熟。这类软件的盈利方式,基本已经成型了:基本功能免费,高级功能付费。从付费用户那赚钱,从免费用户那赚宣传和口碑。比如世超在用的iCost,它的基础记账功能都是免费的,像存钱、报销、退款、标签这些都需要会员的。和我解释完之后,Z也跟我提了一嘴,其实不光是记账,还有待办、日历,这三类App都是大家青睐的创业方向,俗称独立开发者三件套。它们都属于“编程effort不大,但是整体产品收益比较高”的产品,大家自然会做。但世超看到这里,还有一点不能理解。开发一款App,谁不想赚点钱?那赚钱的话,去一条全新赛道,去找一个未被发掘,还不存在竞争的蓝海市场不是更简单吗?非要在这几条赛道上挤吗?我把这个问题,抛给了一位推出好几款开源App的独立开发者艾洛。艾洛说,因为这类软件是高度个性化的。每个人记账,写日记,他都有不一样的需求和偏好。所以即便是市场很卷了,但还是有很多程序员觉得“就这App也能大卖?”“我上我也行啊”“关键他也没满足我的需求啊”。抱着这种想法,很多人认为自己能做出更好的,更符合用户需求的软件来。当然了,也不排除不少程序员,是抱着练手的心态来的。想着不管写这个软件有没有未来,但大家都在写这个,我也试试呗,还能看出自身的不足。所以这三件套,到底是推荐做还是不推荐呢?大厂程序员Z觉得,如果自己做独立开发者,估计也会拿三件套练练手。艾洛则说其实自己也想过做。不过他是一个会给自己泼冷水的人。“这个分类太烂大街了,算了吧”,“写出来也不一定能火,那不是白费脑细胞了吗”。去年在即刻上,独立开发者Kenny也分享了一段自己的想法。他不反对开发者做记账、日记、Todo这类产品,但他反对做毫无特色的。比如只是换个皮肤,其它功能几乎和现有产品一样。我认为Kenny说法挺对,我也觉得艾洛那个泼冷水的想法没啥毛病。因为这类软件,真卷到头了。早在几年前,记账软件们就开始往别的地方卷了。比如叨叨记账可以设置一个虚拟聊天对象,记账的同时也能跟这个对象对话。记账城市把记账变成了一个游戏,记一次账就会建造你的城市。大家之所以这么开发,是因为在记账功能上已经没有可卷的余地了。世超在用的记账App,里面的“退款”、“报销”、“多币种”这些功能,很多记账App也能做到。之前有一款记账软件,我用了4年,但我依然能无痛切换到一款新的软件,就是因为功能都大差不差。我觉得,独立开发者的编程能力不是最重要的,最重要的是他的产品设计和思维。前段时间一个没有编程基础的人,借助AI写了一个“小猫补光灯”,它可以显示不同颜色,用于拍照补光。结果它登上了AppStore付费榜第一。所以独立开发者的三件套,拿来练手可以,想赚钱的话,你需要确保自己有一个杀手锏的想法。不然真可能有点浪费时间了。。。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除!
-
25
03/10
OpenAI爬虫疯狂“偷”数据,7人团队十年心血网站一夜崩了,CEO:太离谱才察觉
“这基本上是一次DDoS攻击。”几天前,乌克兰一家专注于人体3D模型的网站Trilegangers突然崩了,这让整个团队以及老板都有些措手不及。起初,该公司CEOOleksandrTomchuk只是收到一则警报,进而发现公司的电子商务网站已完全瘫痪了。一经排查,殊不知,该团队发现,罪魁祸首竟然是——OpenAI此前研发的一款机器人GPTbot。7人花了十余年时间构建的网站,差一点毁于一旦据悉,Trilegangers是一个销售3D扫描数据的网站,这家拥有七名员工的公司花了十多年时间,建立了所谓的网络上最大的“人体数字替身”数据库,即从真实人体模型扫描而来的3D图像文件。Triplegangers提供从手、头发、皮肤到完整身体模型的3D对象文件和照片,一应俱全。其处理的数据涵盖多个类别,如“脸部”、“全身”、“带姿势的全身”、“全身情侣”、“手部”、“手部雕像”等,网站展示的内容正是其业务核心所在。具体来看,以“脸部”数据为例,这一类别中有1509人的数据,每个人注册了大约20种不同的面部表情。在其他类别中,每个产品至少有三张图像,因此总数据据说有数十万个点。这一点也得到CEOOleksandrTomchuk的证实,其表示,“我们有超过65000种产品,每种产品都有一页内容介绍,每页至少有三张照片。”Trilegangers所做的业务就是面向3D艺术家、视频游戏开发者,以及任何需要数字化再现真实人类特征的人群销售这些数据。然而,OleksandrTomchuk称,不久前OpenAIGPTBot发送了“数万”个服务器请求,试图下载全部内容,数十万张照片及其详细描述。这有一种,但凡Trilegangers有的,OpenAI都要的感觉,可是这些内容实则为付费产品。“OpenAI使用600个IP来抓取数据,我们仍在分析上周的日志,也许更多,”该团队在谈到机器人试图访问其网站的IP地址时说道。“他们的爬虫程序正在摧毁我们的网站!”OleksandrTomchuk说,“这基本上是一次DDoS攻击。”那么GPTbot究竟是什么?不难回忆起来,GPTbot是OpenAI在2023年8月推出的一款网络爬虫机器人,用于抓取互联网数据,为训练和改进大模型(如ChatGPT)提供素材。它会自动访问公开可用的网站,收集文本数据来增强模型能力。OpenAI此前表示,GPTBot会严格遵守任何付费墙的规则,不会抓取需要付费的信息,并且也不会收集能追踪到个人身份的数据。即遵循网站的robots.txt文件中明确标示的规则。如果网站配置了禁止GPTBot抓取的标签,它理论上会停止访问该网站。而robots.txt是一个用于网站管理的文本文件,它告诉搜索引擎爬虫(如Googlebot、Bingbot或GPTBot)哪些网页可以或不可以被抓取。这是一种被广泛接受的网络标准,称为机器人排除协议(RobotsExclusionProtocol,REP)。简单来看,如果你不想让GPTBot访问你网站的任何内容,可以将以下代码添加到目录中robots.txt里面:User-agent:GPTBotDisallow:/如果你想要允许访问网站上的某些内容(例如特定目录或文件),可以用以下代码对robots.txt进行以下更改:User-agent:GPTBotAllow:/directory-1/Disallow:/directory-2/除此之外,OpenAI还公布了OpenAI使用的爬虫IP地址,也可以根据IP地址来拒绝访问。OpenAI公开了以上这些方式,并声称会遵守规则,显得诚意满满。然而,令人无奈的是,一切的前提是得正确配置好“robots.txt”文件,才可以尽可能地避免被爬虫。这一次Trilegangers就落到了“robots.txt”的坑中。虽然其在官网“使用条款”的第5条行为准则中清清楚楚地写着:未经TG明确事先书面同意,不得使用任何机器人、爬虫、网站搜索/检索应用程序或其他手动或自动设备来检索、索引、抓取、挖掘数据或以其他方式收集网站内容,也不得复制或绕过网站的导航结构或展示方式。尽管有上述限制,在遵守我们网站根目录中robots.txt文件中发布的任何指示的前提下,TG授予公共搜索引擎的运营者权限,允许其使用爬虫从我们的网站复制材料,但仅限于为创建这些材料的公开可用、可搜索索引的唯一目的(且仅限必要范围内),不得缓存或存档这些材料。TG保留随时和不经通知撤销此权限的权利,无论是一般性撤销还是针对特定情况。未经TG许可,禁止执行以下行为:1.将本网站上展示的任何内容或图像用于人工智能或机器学习(“AI/ML”)研究或研究;2.提取、复制、分发或向任何第三方提供本网站展示的任何内容或图像,用于AI/ML算法的训练、测试或开发;3.参与任何涉及利用本网站内容或图像的AI/ML相关活动,包括但不限于数据集编制、模式识别、神经网络训练或任何形式的计算分析。任何试图在未经TG有效许可的情况下将本网站内容或图像用于AI/ML目的的行为,均被视为违反本网站条款及我们的供应条款与条件,可能导致法律诉讼,并寻求适用法律下的一切补救措施。但如今看来,仅凭这一点的声明毫无作用,GPTBot还是爬取到了其网站的内容,还让网站整个宕机了。对此,据Techcrunch报道,此次Trilegangers并没有正确使用robot.txt,其中的标签没有明确告诉OpenAI的机器人GPTBot不要爬取该网站内容。这就意味着OpenAI和其他公司就会认为他们可以随心所欲地抓取数据。更令人气愤的是,即使Trilegangers告诉了GPTBot不要抓取自家网站的内容,谁能料到,OpenAI还有ChatGPT-User和OAI-SearchBot机器人用来做爬虫工具。还值得注意的是,即使更新了网站的robots.txt,也不要掉以轻心,因为OpenAI的系统可能需要大约24小时才能才能识别更新的robot.txt文件。https://platform.openai.com/docs/bots正所谓爬虫的工具千千万,企业有时根本防不胜防。“如果爬取的数据少一点,或许都发现不了”就像这一次,如果不是OpenAI的GPTBot爬取的数据过于庞大,也许Trilegangers可能还发现不了。Tomchuk在接受外媒Techcrunch采访时表示,「如果爬虫更加“温和”地抓取,他可能永远都不会发现。」“这令人害怕,因为这些公司似乎钻了一个漏洞,声称‘你可以通过更新带有我们标签的robots.txt文件选择退出抓取’,”Tomchuk说,但这实际上把责任推给了网站所有者,让他们必须了解如何屏蔽这些爬虫。更可怕的是,Tomchuk称他们连GPTBot究竟是从何时开始抓取的都不知道,更不要说OpenAI具体抓取了哪些内容。这也让Tomchuk有些担心,“我们的业务对权利要求非常严格,因为我们扫描的是实际的人体,按照欧洲的GDPR等法律,他们不能随便拿网络上的任何照片使用。”事件发生后,Triplegangers的网站不仅因OpenAI的爬虫被迫下线,CEOTomchuk还预计将收到一份因爬虫导致的高CPU消耗和大量下载活动而产生的高额AWS账单。同时,Tomchuk称他也没找到可以联系OpenAI的方法,也无法让他们删除这些素材。为此,Tomchuk无奈之下选择用Trilegangers官方Twitter账号发了一条致OpenAl、Microsoft、Meta、Google和其他使用爬虫程序的公司的官方声明:除用于搜索目的的页面索引外,严禁在我们的网站上使用爬虫程序。未经有效许可,产禁将我们网站上的任何公开内容用于AI或ML应用程序。截至目前,Triplegangers配置好了正确的robots.txt文件,并创建了一个Cloudflare账户,用于阻止GPTBot以及他发现的其他爬虫,例如Barkrowler(一个SEO爬虫)和Bytespider(TikTok的爬虫)。引发争议的数据爬取Triplegangers的经历引发了广泛关注,其公开此事后,不少其他网站运营者纷纷表示也曾遭遇类似情况。markerz:我的其中一个网站曾被Meta的AI爬虫Meta-ExternalAgent完全摧毁。这个爬虫似乎有些“天真”,没有像GoogleBot那样进行性能回退(performanceback-off)。它不断地重复请求内容,直到我的服务器崩溃,然后短暂停止一分钟,再次发起更多请求。我的解决方法是添加了一条Cloudflare规则,直接屏蔽该User-Agent的请求。我还为链接增加了更多nofollow规则,并更新了robots.txt文件,但这些规则仅仅是建议,某些爬虫似乎会忽略它们。Cloudflare还有一个功能可以屏蔽已知的AI爬虫,甚至怀疑是AI爬虫的请求:https://blog.cloudflare.com/declaring-your-aindependence-block-ai-bots-scrapers-and-crawlers-with-a-single-click/。尽管我不喜欢Cloudflare的集中化,但这个功能确实非常方便。griomnib:我从事网站开发已经数十年,同时也从事过爬取、索引和分析数百万个网站的工作。只需遵循一个黄金法则:永远不要以比你希望别人对待你的网站更激进的方式加载其他网站。这并不难做到,但这些AI公司使用的爬虫既低效又令人厌恶。作为一个网站所有者,这种行为让我觉得他们对网络的基本礼仪毫无尊重。而作为一名从事分布式数据采集的工程师,我更是被这些爬虫的糟糕和低效深深冒犯了。至此,Tomchuk也分享了他想把这一经历公开的原因,他希望其他小型在线企业了解,发现AI爬虫是否在抓取网站的版权内容的唯一方法就是主动检查日志。他并不是唯一一个受爬虫“侵害”的人,也绝非最后一个。Tomchuk警告道:“大多数网站甚至不知道自己被这些爬虫抓取了。现在我们不得不每天监控日志活动,以发现这些爬虫。”本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除!
-
25
03/10
AI硬件的赚钱逻辑变了,不靠硬件靠订阅,毛利率堪比软件公司
AI让定制化服务成为可能自ChatGPT推出以后,硬件就成为了AI市场最热门的赛道之一。AIPin、RabbitR1、以及Meta的雷朋眼镜,还有智能戒指Oura,有成功的,也有不少失败的。在跑出来的那些AI硬件上,乌鸦君发现了一个很有趣的趋势:相比过去单靠卖硬件赚钱,在新一代的AI硬件上,软件服务的收入占比大幅提升。甚至部分AI硬件公司靠着订阅服务,毛利率做到了接近软件公司。在AI硬件领域,这样的公司正在变得越来越多。比如,去年很火且估值超50亿美元的智能戒指Oura、年化收入1亿美元的AI卡片录音机PlaudNote,还有24年订阅服务ARR超过1亿美元的智能宠物追踪器Tractive,皆是如此。那么,为什么订阅服务成为AI硬件重要的商业模式?如何又应该如何理解这种变化?01硬件+订阅模式兴起,AI硬件毛利率堪比软件公司近年来,订阅模式正在成为越来越多AI硬件的标配。在去年跑得不错的AI硬件公司里,这一趋势体现得尤为明显。智能戒指Oura——估值52亿美元,毛利率接近软件公司Oura不必多说,国外大火的智能戒指,主要用于睡眠监测。OuraRing能够监测用户的睡眠质量、身体活动、压力水平,甚至心率、皮肤温度和血氧饱和度等身体指标,帮助用户准确追踪、提升睡眠质量,就像是一个“指上睡眠研究所”。最新款的Oura4戒指售价为349美元,外加每月5.99美元的订阅费,提供每日健康报告、个性化建议以及教育视频和音频。根据前段时间公布的数据,Oura的智能戒指已经销售了250多万枚,今年的销量额将翻一番,达到5亿美金。去年年底,Oura完成了一轮2亿美元的D轮融资,估值高达52亿美元。之所以Oura能够拿到这么多钱,全靠订阅服务。按OuraCEOTomHale的说法:Oura之所以能够不断拿到VC的钱,主要也是得益于我们基于订阅的业务模式,这种模式使我们的毛利率看起来更像一家软件公司,而不是硬件公司。新的融资将帮助Oura出圈,进入更多医疗领域。AI卡片录音机PlaudNote——年化收入1亿美元,连续2年增长10倍PlaudNote则是一款AI卡片录音机,是一个能贴在iPhone背面的卡片,接入了大模型,能够实现录音、整理和摘要等功能。从功能上看,Plaud搭载了ChatGPT。录音时,可以用APP进行同传,并带有时间轴;录完后,能通过AI对录音内容进行整理、提炼、摘要。截至目前,PlaudNote已交付超30万台,年化收入1亿美金,连续2年达10倍增长。PlaudNote同样采用了“硬件+订阅”并行的收费模式。除了购买PlaudNote硬件外,用户还需要订阅9.9美元/月(约72元)的软件会员,才能享受完整服务。通过订阅服务,Plaud成功拔高了产品均价。在PlaudNote单一硬件的众筹早鸟价是89美元,后续通过增加服务包、套餐等多种手段,PlaudNote的定价上升到了159美元,折合人民币大概1157元。智能宠物追踪器Tractive——24年订阅服务ARR超过1亿美元Tractive的核心产品是猫、狗追踪器,其主要功能是让宠物主可以随时通过APP或PC端对宠物进行全球位置跟踪和活动监控,一旦宠物离开预设的安全区域(虚拟围栏),追踪器会立刻通知宠物主。除了卖硬件外,Tractive也推出了订阅模式,为宠物提供健康监测服务。比如,通过Tractive产品能够通过集成传感器采集宠物的健康数据,例如体温、心率、活动量等。这些数据上传到云端后,通过AI算法生成健康报告,并提供疾病预警。仅2024年,Tractive订阅服务的ARR就超过了1亿美元,不包括硬件销售收入。智能喂鸟器BirdBuddy——每月6美元,用AI识别鸟类BirdBuddy是一家斯洛文尼亚的公司,其核心产品是智能喂鸟器,曾创造过仅一天时间就众筹了超过160万美元的纪录。它通过高清摄像头和AI技术,能够识别出后院到访的每一只小鸟,并为其拍照留念。爱鸟人士可以通过手机APP,随时查看自家后院的“小鸟访客”,甚至还能为它们起名字。除了基础功能外,BirdBuddy也推出了订阅服务,每月6美元,提供自然智能、给鸟命名等AI服务。通过这些订阅服务,用户将能通过喂食器上的摄像头追踪特定某只鸟,并了解它的健康状况。除了国外的AI硬件厂商外,我们也能在国内的部分厂商上看到这一趋势。比如,前不久闪极发布999元AI眼镜,也留下了软件使用付费的商业模式的空间——两个AI功能,AI闪极和AI云盘,年订阅价格299元,不过首年免费。另一家AI眼镜公司界环也把订阅模式纳入了自身的服务体系,每月19.9元为用户提供AI服务。02AI让定制化服务成为可能“硬件+订阅”模式的好处很多,通过增加订阅服务并持续为用户增加价值,不仅推动了收入持续增长,还创造了一个更具粘性的产品。用OuraCEOTomHale的话说:这些功能提高了Oura的客户留存。对于大多数可穿戴设备来说,一年之后就会有一大部分被扔进抽屉,但许多Oura的客户会一直使用几年。其实,硬件+软件模式不是第一次在消费电子领域出现。这样的故事曾经在很多公司身上都出现过。但最终都不了了之。那么,订阅服务为什么能够在AI硬件上跑通?在乌鸦君看来,主要源于这两点变化:首先,软件的重要性提升,甚至可以说软件是驱动AI硬件落地的关键因素。从架构上看,在原生多模态AI大模型出现后,结合硬件会出现新的信息交互和处理模式。借用公众号“小丸子酱酱酱聊商业“的说法,AI硬件的交互形态变成:多模态信号输入→传感器算力→AI模型处理和计算->定义交互方式->落地UIUX;在这个过程中,以AI大模型技术为核心的软件技术,不仅驱动了用户体验的提升,也能实现硬件能力的扩展。与传统的硬件相比,AI硬件的价值在于软硬件深度融合,进而实现特定场景的一站式解决方案。举个例子,在PlaudNote出现之前,录音笔已经是一个很成熟的产品。PlaudNote的成功之处在于,把一个收集音频的硬件设备,利用AI技术扩展到提供转写功能,再到提供优质总结的能力,形成在办公场景下的一站式解决方案。其次,传感器提供的高质量数据,加上AI强大的信息处理能力,让定制化软件服务成为可能。AI硬件的传感器本身可以理解为人器官的延伸,麦克风、扬声器、摄像头等传感器能够嘴巴、耳朵、眼睛的数据,进而采取人所相关的数据。理论上,只要用户的数据积累足够,甚至AI硬件甚至可以成为一个人的数据中心。同时,AI本身又具备强大的信息处理能力。伴随输入的数据量增加,AI硬件也可以据此改进产品,实现更深度和复杂的功能,进而更容易实行订阅制的商业模式。从这个角度上说,AI硬件的价值不仅仅是计算中心的迁移,也让软件和硬件的融合达到了一个新的高度,进而有机会诞生新的商业形态。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除!
-
25
03/10
被Github 上的Stable Diffusion 坑惨了?失业、欠帐、恐慌,工程师怒喷:AI软件毁了我
这位曾用代码构建童话世界的工程师,被困在了由AI工具引发的一场噩梦里。一个普通的夜晚,前迪士尼工程师MatthewVanAndel因好玩下载了一款用于根据文本提示创建图像的免费AI工具,却在之后声称这个决定让他的生活和事业都毁于一旦。这位曾用代码构建童话世界的工程师,被困在了由AI工具引发的一场噩梦里。据悉,VanAndel本以为这是代码共享平台GitHub上的一个有用工具,结果却发现它是一个恶意软件。在使用这款AI图像生成器的五个月时间里,他的个人计算机被侵入,直接导致其个人账户凭据和迪士尼超1TB的公司内部信息被公开泄露,甚至有外部攻击者借此登入迪士尼的公司系统发布敏感信息,包括客户数据、员工护照号以及收入数据。并且,这次经历使VanAndel本人在经济和情感上遭受重创,不仅丢了工作、损失了约20万美元,声誉也受到了损害。直到现在,Andel的个人及家人账户仍然在遭受威胁。近期,他正在试图通过律师向前公司交涉以八位数和解金来弥补其工资损失和情绪困扰的要求。消息传出后,网上许多人都在疑惑,这种事情究竟是怎么发生的?使用公开的AI工具为何能带来如此严重的后果?GitHub平台为何没有发现?牵涉其中的是哪款AI图像生成器?为此,我们去深入了解了整起事件。被这款AI工具“坑害”的全过程VanAndel的悲惨命运在去年2月埋下种子。当时,VanAndel坐在家里的电脑前,无意中在GitHub上发现了一个文生图AI工具,非常适合他和两个儿子一起玩创意游戏。GitHub受到数百万人的信任,开发人员可以在这里共享代码和工具,似乎是一个安全的选择。他点击下载了这个工具,却不知道这个简单的举动即将毁掉他的一生。五个月来,这款免费AI软件静静地待在VanAndel家的电脑上,虽然文生图效果不错,但这款AI助手中却包裹着恶意软件,并像潜伏特工一样潜入他的系统。直到去年7月,一条令人不寒而栗的信息通过Discord论坛平台发送到了他的电脑上,对方称已掌握关于他本人的大量情报——包括几天前他跟迪士尼同事共进午餐的细节。VanAndel的大脑开始飞速运转,因为他敢肯定迪士尼以外的人不可能接触得到这些情况。毕竟这个通过Discord论坛给他发过消息的人,没办法知晓他在Slack工作频道里聊过什么。紧接着,对方又发来另一条消息:“我已经掌握了跟你个人及职业生活相关的敏感信息访问权。”到这里VanAndel终于可以肯定,自己是被黑客入侵了。黑客自称是俄罗斯黑客活动组织的成员,早在五个月前就已经入侵了VanAndel的电脑。但安全研究人员认为,这位自称Nullbulge的黑客很可能是头“孤狼”,而且应该是美国人。VanAndel马上打给了迪士尼的“救援队”,这是一支为快速应对网络威胁而设立的企业团队。他们证实VanAndel的Slack账户已遭入侵,但在他的办公笔记本电脑上没有发现任何可疑迹象,因此建议他检查一下个人设备。他之前的杀毒软件没在个人PC上发现任何异常,但在安装第二款杀毒程序之后,引发此番风波的罪魁祸首立刻浮出了水面。在加利福尼亚州的家中,VanAndel查看了他从黑客那里收到的一封电子邮件。在VanAndel与迪士尼响应团队沟通的同时,黑客还发来了一封电子邮件,明确表示他能够登录VanAndel的个人邮箱账户,还抱怨自己发出的第一封邮件被VanAndel标记为垃圾邮件,第二封则被直接扔进垃圾箱,并警告称,他的入侵活动即将开启新的阶段。“马上回邮件,照我们说的做,否则指定没你好果子吃。”据VanAndel所知,黑客只有一种办法能够访问到他的电子邮件,那就是操纵1Password——这是一款密码管理工具,VanAndel用它来存储密码和其他敏感信息,包括“会话cookie”。这些数字文件持续存储在他的电脑上,帮助他快速访问包括迪士尼Slack频道在内的各种在线资源。他用来保护自己数字生活的密码管理软件。VanAndel没有向黑客提供更多信息,他重置了存储在1Password中的数百条凭证,选择去报警。但黑客第二天一早就兑现了威胁,这个动机不明的神秘黑客组织,一口气将4400多万条迪士尼内部Slack聊天消息、超过18800份电子表格和至少13000份PDF发布到了网上,并公布了VanAndel存储在1Password中的全部登录凭证。至于这些内容是怎么来的……是黑客利用VanAndel的登录凭证从雇主处疯狂攫取而来。黑客还在网上声称,自己在迪士尼有一个“内线”。而处于事件漩涡中心的这款AI图像生成器,被曝很可能是StableDiffusion。去年6月,据外媒报道,以厌倦了大公司通过AI滥用他人的工作为由,NULLBULGE黑客组织开始通过破坏Github上免费共享的扩展ComfyUI_LLMVISION来攻击使用StableDiffusion的流行界面ComfyUI的用户,从而将恶意软件嵌入到目标用户的电脑中。并且,他们声称自己的行为是打击艺术品盗窃、加密推广和AI生成艺术品的运动的一部分,并指责用户犯下了“艺术品盗窃”罪。该组织随后还在其网站上发布了一份据称可以访问数百名用户账户的凭据列表。至于为何GitHub平台没有发现这个工具已存在“问题”,有网友猜测了两种情况:一是,Github是各种不受限制代码的存储库,其中涉及的每一段代码都是“合法的”,只是它的使用方式是坏的;二是可能是因为代码的某些部分被故意混淆了,代码中可能含有加密字符串。这起事件的后果此番黑客攻击促使迪士尼网络安全团队开始评估损失。据该黑客组织称,其泄露出的迪士尼内部数据超过1TB,包括他们未发布的项目、代码、图像、登录凭据以及指向内部网站和API的链接。迪士尼则在去年8月的一份监管文件中提到正在调查这起事件,但预计不会对其运营或财务业绩产生重大影响。黑客事件发生后,迪士尼方面通知员工正考虑放弃Slack,尝试精简办公协作工具。与此同时,VanAndel在这起事件发生几周之后失业了。在对他的工作电脑进行取证分析之后,迪士尼将其解雇,并表示在他的设备上发现了访问过色情内容的记录。VanAndel则坚决否认曾在自己的工作电脑上有过此类行为。迪士尼发言人在一份声明中指出,“VanAndel先生声称他并未进行过导致他被解雇的不当行为,但公司在对发放给他的办公设备进行了审查,并从中发现了有力证据。他的健康保险被终止,约20万美元的奖金也打了水漂。”VanAndel只能无力地辩解,“我是黑客攻击的受害者呀……”Matthew的兄弟姐妹ChristaMaier和StephenVanAndel对外表示,黑客通过嵌入在知名AI图像生成器中的恶意软件,在他不知情的情况下访问了他的个人设备。“这是他最初下载的一个工具,只是为了和孩子们一起玩。但它被某种东西污染了,直到几个月后,当他们(黑客)挖掘数据时,这一点才会变得明显。”据了解,包括电子邮件在内的很多账户都受到双因素身份验证的保护。也就是说,除了用户名加密码的组合之外,黑客还得获取其他信息才能成功入侵。大多数人出于方便,通常会选择短信或者手机端应用来验证,而VanAndel的第二道防线则是——1Password。在调查入侵事件的过程中,VanAndel意识到他的“数字生活好管家”1Password并没有受到双重身份验证的保护。默认情况下只需要用户名加密码就能登录,他也没有采取额外措施来启用双因素身份验证。1Password公司发言人指出,一旦用户的计算机上被安装了键盘记录木马,“攻击者就几乎可以不受任何限制发起访问。”这起事件也彻底颠覆了VanAndel的生活,黑客窃取了他的信用卡号并大肆消费,滚滚账单如雪片般飞来,甚至他的个人乃至财务账户登录信息也被泄露了出去。他开始接到媒体的电话,还有陌生人的奇怪来电和短信。VanAndel几乎吃不下饭也睡不着觉,时常被惊恐和焦虑的情绪吞没。攻击者还把VanAndel的个人信息公布到了网上,用社保号码就能顺利登录他家中安装的Ring摄像头,他的在线社交媒体账户被无数掌握了凭证的陌生人用于发布大量冒犯性言论。就连VanAndel孩子们的在线账户也受到了黑客攻击的波及。VanAndel一家人作为两个儿子的父亲,42岁的VanAndel痛苦地表示,“这种被侵犯的感觉实在难以形容。”现在VanAndel正努力回归正常生活。他找了份临时工作来支撑家庭生活,他妹妹则在GoFundMe上发起众筹帮助他度过难关。去年12月19日,他的律师向迪士尼发出一封索赔函,要求对方就工资损失和精神折磨支付八位数的赔偿金。VanAndel表示,时至今日,他仍会在网上看到有人尝试用Nullbulge公布的泄露凭证入侵他的账户。结语VanAndel的经历对于企业和个人来说都不失为一记响亮的警钟,让人们意识到自己随时可能面临黑客攻击的风险。网络安全专家们表示,近年来窃取凭证市场经历了一波大力发展,用于窃取凭证的黑客工具也如雨后春笋般涌现。在疫情期间,企业为了支持远程办公而开放了员工从家中访问业务系统的权限,而黑客则很快意识到家用电脑已经成为通往企业环境的后门。黑客们开发出各种恶意工具,即信息窃取程序,并将其隐藏在人们从互联网上下载的各类软件当中。黑客们借此窃取凭证,之后再通过网络转售。根据谷歌负责调查网络入侵的Mandiant团队所言,在去年以经济为目的的网络入侵活动中,有近40%使用到被盗凭证,相较于2022年已经增长了一倍。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除!
-
25
03/10
曾风靡全球的通讯软件Skype,被时代抛弃了
球互联网江湖再无Skype!全球科技行业曝出一条重磅新闻,曾风靡全球的一款知名通讯软件官宣将关闭,又迎来了一滴时代的眼泪。《新品略财经》关注到,据多家国内外媒体报道,当地时间2月28日,微软宣布通讯通话和消息服务软件Skype将于5月5日关闭,并鼓励Skype用户迁移到其免费的Teams应用程序。在当今国内这个微信、抖音风靡的移动互联网时代,现在有年轻人可能没有听过Skype,但对用过它的人来说,是满满的青春回忆。Skype是一款通讯软件,迄今为止,已经拥有21年的历史,是一个名副其实的老牌互联网通讯软件,如今将要正式关停,自然会引发了全球关注和热议。那么,Skype是如何风靡全球的,有着怎样的发展故事?又为何从风靡全球,到如今被时代抛弃的?01诞生于欧洲,曾风靡全球,三次易主人类科技互联网历史时代浪潮滚滚向前,每一个时间段都会诞生改变人们沟通方式的软件,Skype就是其中之一。有意思的是,Skype并不是诞生于互联网科技发达的美国,而是诞生在一个欧洲小国。2003年,JanusFriis和NiklasZennström在爱沙尼亚推出了Skype,他们与一群毫无电信经验的同学合作,共同打造了这款基于互联网语音协议的网络电话软件,Skype这一名字的来源是“skypeertopeer”。Skype是一款网络通话软件,在其诞生的年代,话费,特别是国际长途通话费用很昂贵,Skype的出现自然很快就吸引了很多用户使用。Skype很快席卷全球,只用了一年时间用户数量突破1100万,其背后有一个偶然因素就在于当年碰到了非典疫情,很多人被Skype的功能吸引了,就此成名。到2005年,用户增长至5400万,还盈利了,预计年收入可达6000万美元。Skype的用户呈现爆炸式增长,还赚钱了,迅猛的发展势头很快吸引了跨境电商平台eBay的关注。2005年,eBay以26亿美元的惊人高价收购了Skype,这是Skype第一次易主。当时eBay收购Skype打的算盘如今在我们现在看来有点莫名其妙。eBay计划通过Skype让买卖双方直接沟通,以提高成交量,并且通过电话功能获利。在eBay的操盘下,Skype的用户越来越多,到2008年时,总用户超过4.05亿,通讯业务收入也随之上升。2008年全球金融危机爆发,eBay的业绩出现了负增长,其股价暴跌,根本就无暇顾及Skype。2009年,eBay的新任CEO认为Skype没有给eBay核心业务带来明显收益,决定将其分拆IPO,但是这一算盘落空。很快,就这样eBay迎来了第二次易主。当年,eBay以27.5亿美元的价格把Skype的70%股权出售给了SilverLake牵头的投资集团,后者也曾想让Skype上市,但最终还是没成功。到了2011年,Skype的月活跃用户已达到1.7亿,算是一款火爆的软件,当时想发力即时通讯业务的微软,以85亿美元的价格收购了Skype,这是其第三次易主。微软原本计划要把Skype打造成一个10亿活跃用户的软件,要将其和微软多款产品整合,可最终也未能如愿。02Skype为何被时代抛弃了?Skype是一款能够载入全球互联网发展史册的软件,如今将要关停了,人们自然会讨论,为何Skype会没落?在《新品略财经》看来,Skype是一个崛起于传统PC互联网时代,衰落于移动互联网时代,是互联网科技发展的产物,也是一个被时代抛弃的产物,其从风靡全球到如今被抛弃,不仅有市场竞争的原因,更有其内部原因。毫无疑问,在当年那个互联网刚刚起步的年代,Skype凭借着免费功能,不用钱就能在线语音通信,绝对是一个划时代的经典产品,也正是在当时的互联网时代背景下,Skype注定会成功,成为香饽饽,被全球科技巨头争着抢。然而,随着互联网时代的发展,在国际市场上,Skype的替代软件越来越多,Skype渐渐地就被人们抛弃和遗忘了。特别是进入移动互联网时代,iPhone等智能手机的出现,进一步改变了人们的通讯方式,苹果的iMessage和FaceTime就直接替代了Skype。移动互联网崛起了新时代的通讯工具,比如WhatsApp风靡全球,成为外国人主要的即时通讯App之一,后来Facebook在2014年收购了WhatsApp,并推出了跨国通话功能,就更没Skype的啥事儿了。激烈的市场竞争,后来很多通讯软件都直接替代了Skype,注定Skype会被越来越多的人抛弃使用。Skype如今被关闭的命运,还有更多内部原因。其中一个原因就是自己不争气,面对科技进步和激烈的市场竞争,Skype虽然进行了多次界面重新设计,不但没有吸引到新用户,反而遭到了忠实用户的批评。另外一个关键原因就是Skype爹不疼,不被重视,被自家的爹逐渐抛弃了。虽然Skype被微软收购,但却得不到微软的重视。微软后来在2016年推出了企业级协作工具Teams,与Office生产力软件深度集成,就相当于进一步抛弃了Skype。后来在新冠疫情期间,远程办公和在线学习需求激增,全球很多用户都需要使用视频、语音通话交流及在线视频会议,Skype的使用量虽然有所提升,但用户更喜欢用Zoom。微软把重心放在Teams,让Teams用户数越来越多,到2023年其用户数量已经超过3.2亿,相比之下,Skype的日活跃用户只有3600万,已不再是市场主流通讯软件,完全没有存在感。微软早就认为Skype微不足道,已经把希望寄托在了强劲增长的Teams身上,直至现在,微软正式官宣Skype将关闭。03结语Skype,这家诞生于欧洲,靠免费功能崛起,成名于非典期间,后来风靡全球,登上巅峰时刻,还成为被互联网科技巨头争抢的香饽饽,曾风光无限。虽然Skype是一款全球性的通讯软件,但自始至终在全球核心的互联网中国市场一直没有太多的存在感。Skype和微软曾推出的另一款通讯软件MSN一样,虽然曾有一些极小一部分中国用户使用,也曾风靡过,不仅水土不服,还根本无法和中国本土的QQ、微信等社交软件相竞争。Skype的故事是互联网科技时代进步的一个缩影,其实也在中国互联网江湖中上演。比如,中国移动曾推出的飞信,一代人青春记忆的人人网,还有就是被抛弃的BBS中文论坛等,这些软件或平台都被时代抛弃了,但也都曾风靡过。随着科技进步和互联网更新迭代,特别是移动互联网进一步改变了人们的沟通方式,Skype并没有积极主动拥抱,只会越来越掉队。Skype从风靡全球,到如今将正式关闭,被时代抛弃,犹如一滴时代的眼泪,最终留下回忆。Skype的故事也给我们留下了那条很熟悉的商业启示录:不与时俱进,最终只会被时代抛弃。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除!
-
25
03/10
手机学会「点屏幕」了,为什么笨 AI 也有未来?
嘴巴动一动,完成外卖点单去年11月。荣耀为了新机Magic7Pro的发布,策划了一次堪称行为艺术的事件营销。时任荣耀CEO的赵明现场指挥AIAgentYOYO打开美团,下单了约2000杯瑞幸饮料。这一通操作过后,深圳发布会场地周边的瑞幸门店纷纷「爆单」,门店咖啡师忙到崩溃,接到订单的骑手更是在门店排起长队。这次效果显著却略带荒诞意味的事件营销,一定程度上让公众忽略了荣耀试图展示的核心技术:「基于GUI的个人AI智能体」。时至今日,AIAgent功能确实已经不新鲜了。而这个技术的关键点,在「GUI」这三个字上。GUI全称GraphicalUserInterface,图形用户界面。作为一个基于GUI的AIAgent,YOYO不再依赖传统的API接口,而是有了一只虚拟的「手」,直接在代替用户进行图形界面操作。整个代行操作不在「后台」,而是直接在「前台」,在用户的眼皮底下实时发生。需要澄清的是:Magic7Pro市售机型用户的体验可能会与发布会演示存在差异。据财联社报道,当时现场演示用的测试机权限更高,能够自动免密支付和循环点单,这才不停地点出了2000杯饮料。至少在目前,市售机型需要用户明确告知点单细节(例如品牌、品名、杯型、温度等),并且在支付环节需要用户接管确认。这个细节确实重要,但也不至于抹杀这项技术的存在意义。正相反,我们认为,「基于GUI」是个很另类,很有趣,颇具试验性的AIAgent实现路径。AIAgent交互的「前台」新路荣耀YOYO的核心是多模态模型,GUI交互的本质是语言+视觉的理解。·自然语言处理(NLP):理解「点一杯冰美式」的指令;·屏幕状态感知:识别当前界面中的内容,找到正确的按钮、输入框等界面元素;·拟人化操作:像人类一样点击按钮、输入信息;·循环操作:在新的界面中持续解析内容、定位和点击界面元素。关于GUI的操作部分,这最后一步具体是怎样实现的,荣耀方面没有明确透露。一种稳妥的猜测是:它能够获得手机的无障碍功能(accessibilityfeatures)或类似的底层权限,从而控制屏幕点击事件。这最后一步并不是什么难事,甚至比前面几步都简单得多。但除了此前智谱的AutoGLM等极少数之外,确实很少有其它第三方开发者和终端厂商在走GUI交互的路径。在过去,虚拟助理控制软件和智能硬件的方式主要是通过API调用以及物联网协议。这可以理解为一种纯数字(digital)的通讯方式。今年一月,谷歌在三星的指定机型上激活了基于Gemini2.0的AIAgent功能。这次合作也是通过API或类似方式实现的(谷歌称之为Gemini扩展),初期仅支持Gmail、谷歌地图、三星日历、三星时钟等第一方应用,以及Spotify等极少量第三方应用。想要做到规模化,扩充支持的应用,需要开发者做一定量的API接入工作,同时也需要用户许可使用Gemini扩展。Gemini控制手机演示图源:Google谷歌依赖API调用后台接口,而荣耀通过GUI模拟前台操作,二者在实现逻辑上形成了明显区别。后者的好处,在于可以规避API调用这一常规方式,绕过了其背后的商业博弈和数据成本,也可以更快、更容易地扩充支持的应用,实现规模化并改善用户体验。成本是个关键问题。一方面是云服务费用,因为无论是API提供方还是调用方都需要运行服务器来进行操作。另一方面,通过API交换的数据也具有价值,因此具有更高数据价值的API,往往收费也更高。以美团举例,其订单服务在内的基础API收费标准为每百次调用0.15元(前百万次免费)。这还只是基础类API,如果涉及价值更高的管理类API,调用收费提高到每百次0.3元,且无免费额度。另外,API的使用也暗含着一些隐性的商业竞争要素。调用方获得了数据,同时也在向提供方发送数据,而不排除在特定条件下,双方都不希望肥水流向外人田。而在基于GUI的方案下,至少就目前的演示效果来看,荣耀既不需要向美团支付API费用,双方也无需担心数据的归属,包括与之关联的隐私安全等问题。AIAgent只是在「模仿人类」点击屏幕,多么原始却有效的交互方式。回归模拟,返璞归真这种「返祖」式技术路径,让人联想到谷歌在2018年推出的AI电话助手Duplex。Duplex的思路在当时同样有点脑洞清奇:谷歌合成了一个AI语音,替用户给餐馆打电话订位。这个AI语音听起来并不生硬,甚至能够模仿真人的口音、语速、语调,以及加入「嗯」、「youknow」之类的填充词。Duplex技术演示图源:Google今时今日,AI生成语音已经彻底「污染」了电销和客服行业,让人感到厌烦。但至少在当时,用顶尖的NLP和语音合成技术,通过「打电话」这种模拟人类的方式订餐,这种另类的,从数字到模拟(analog)的交互方式,确实令人耳目一新。目前荣耀正在推进的基于GUI的AIAgent,在我看来同样属于一种从数字到模拟的实现方式,用原始与先进相结合的思路,带来了全新的可能性。基于GUI不一定是实现手机AIAgent的最佳路径,但不可否认它确实很有趣,甚至有点「硬来」的意思。·对于用户来说,使唤这样的AIAgent没有学习成本,不需要研究提示语法;·而对于第三方应用和服务平台来说,也几乎不需要额外的开发成本就可以接入。甚至反过来看,它们也无法拒绝被「接入」,因为压根就没有发生真正意义上的「接入」行为。至少以Android目前的沙箱机制来看,应用层不太能够「抵抗」系统底层的行为。基于GUI的AIAgent,既是一种对传统人机交互的致敬,也为AIAgent的落地和体验提升,提供了一种降低门槛、提高兼容性的路径。有时候,最趁手的工具,真就只是一根干净简洁的大棒。大模型与人机交互结合,「笨」AI也有未来在今天用户的主要需求场景上,有两种AIAgent。一种是高智商型,能够解答复杂问题,完成困难的工作,比如DeepSeek、Claude、以及前几天大热门的Manus。这也是现在最流行最受关注的AIAgent/Chatbot种类。但我们同样需要另一种懂事能干的AIAgent,它对用户的使用技巧没有很高的门槛,用户只要输入一两句简单直白的命令,它就能理解,并且把各种并不复杂的事给办好。今天可以点外卖,将来它还能够帮你挂机放置类游戏,给指定好友的朋友圈点赞,甚至自动把刚拍下的一张照片修改一下发到社交网络。只要是用户能做的,基于GUI的AIagent一样能做。门槛低,上限高,适应性强,用起来更顺手,可能是这一类AIAgent的主要特色。这类选手不需要成为理解世界的大学者,只当好执行任务的工具人就足矣。2013年的电影《云端情人》(Her),曾经赋予人们展开无限的遐想。当时也正值NLP技术大爆发,许多优秀的语音场景产品和技术涌现出来。一些研究者和从业者笃信,自然语言对话将会成为AI交流的最主流方式。然而去年昙花一现的硬件产品AIPin,以及开发它的Humane公司越走越黑的路,不禁令人怀疑《云端情人》设想的乌托邦是否那般美好,语音究竟是不是Chatbot/Agent的终极答案。HumaneAIPin图源:Humane进入触屏时代,交互的门槛显著降低,以至于幼儿也能轻松地掌握。按照AI开发者们经常采用的比喻,大模型们的「智力」也恰如儿童。那么让AI通过触屏界面学习人类行为,听上去上还是很有希望的。毕竟,你的伴侣不一定需要一首AI写的诗,却可能需要你按烂屏幕去抢一张周杰伦的演唱会门票。前几天Manus刷屏,再次佐证了我们曾做出的一个预测:大模型将成为智能手机新的操作系统,自然用户界面(Naturaluserinterface,NUI)将逐步替代现有的GUI。至少在目前看来,历经半个世纪发展的GUI仍会是人机交互的绝对主流。不过,大模型与UI结合,对人机交互进行一次前所未有的重新定义,甚至成为新的操作系统——这样的未来,的确越来越清晰了。本文来源:36氪文章转载于其他网络,如有侵权请联系我们及时删除!