为什么我们要有自己的ChatGPT?
近期,在ChatGPT的热潮席卷之下,现已稀有家公司官宣了自己要做ChatGPT或与其相关的音讯,其间,一些公司的确长时刻深耕AI范畴,并有必定的技能沉淀;也有一些公司借机炒作和玩噱头,期望能时刻短进步股价或许转移视线(往往是经营不善)。
从2020年开端,业界以为AI工业现已进入泡沫期,详细的落地愁坏了一众技能不深而烧钱不止的公司。这样的布景下,ChatGPT的鼓起让整个AI工业看到了一丝期望。即使此前现已有比较智能的虚拟帮手呈现,可是ChatGPT展示出来的常识储藏广度和灵敏应对水平,都令一切的智能帮手汗颜,而且现已有了无数值得等待的未来运用场景。
摩拳擦掌的国内企业
从互联网到科技再到金融,预备参加这场战争的我国企业现已卯足了劲,不只为了股价,或许还为了可以在未来有故事可讲。
百度
百度正在打造我国版的类ChatGPT项目——文心一言(ERNIE Bot)。百度在人工智能四层架构中,有全栈布局。包含底层的芯片、深度学习结构、大模型以及最上层的查找等运用。而文心一言,坐落模型层。百度方面称现在该产品在做上线前的冲刺预备作业,估计三月份完结内测,面向大众敞开。
阿里
有记者从阿里巴巴处得悉,阿里版谈天机器人ChatGPT正在研制中,现在处于内测阶段。此前,有媒体报道,阿里达摩院正在研制类ChatGPT的对话机器人,从曝光截图来看,阿里巴巴或许将ai大模型技能与钉钉出产力东西深度结合。据悉,阿里版别的ChatGPT的对话机器人将和钉钉深度结合。
小米
小米方面表明:在ChatGPT范畴有丰厚落地场景,未来将加大相关范畴人力和资源投入。
知情人士泄漏,小米在ChatGPT范畴有丰厚落地场景,包含小爱对话、机器人等,其间小爱具有巨大数据支撑,会让小米在大模型方面开展更敏捷。据悉,此前小米在AI大模型上已有多路并行测验,未来将加大相关范畴人力和资源投入。
京东
京东方案结合ChatGPT的办法和技能点,融入到产品服务中来,推动人工智能的工业落地。京东集团副总裁、IEEE Fellow何晓冬表明,京东是加快AIGC & ChatGPT规模化落地的最佳场景。他称,京东云旗下言犀人工智能渠道已聚集文本、声响、对话和数字人生成等四方面展开作业,将凭借ChatGPT等相关技能作用加快我国人工智能范畴的运用落地。何晓冬介绍,在文本生成、语音生成、对话生成、数字人生成方面,京东均已展开了相关作业。
网易有道
有道AI技能团队已投入到ChatGPT同源技能(AIGC)在教育场景的落地研制中,现在该团队已在AI白话教师、中文作文修改等细分学习场景中测验运用。公司有望赶快推出相关的demo版产品,该产品的问世将标志着AIGC技能在国内互联网教育场景的初次着陆。
腾讯
腾讯方面表明,现在在相关方向上已有布局,专项研讨也在有序推动。腾讯继续投入AI等前沿技能的研制,依据此前在AI大模型、机器学习算法以及NLP等范畴的技能储藏,将进一步展开前沿研讨及运用探究。
据内部人士介绍,产品侧腾讯已推出混元AI大模型,完好掩盖NLP(自然言语处理)、CV(核算机视觉)、多模态等根底模型和许多职业/范畴模型。腾讯表明,跟着AIGC鼓起,未来混元AI大模型会不断推动在文本内容生成、文生图等范畴的继续晋级。
360
2月9日,360在股票交易反常动摇公告中指出,公司现在在类ChatGPT、文本生成图画等技能在内的AIGC技能上有继续性的研制及算力投入,但到现在,所构成的悉数作用均仅作为公司内部自用的出产力东西运用,公司的类ChatGPT技能的各项目标只能到达略强于GPT-2的水平,与当时的ChatGPT比较尚有代差的落后。
当天,360创始人周鸿祎在与搜狐创始人张朝阳对话时,初次谈到ChatGPT。他直言,假设企业搭不上ChatGPT这班车,很或许会被筛选。一起他指出,“做查找引擎的企业最有时机参加研讨类ChatGPT的产品,360必定不会抛弃对这门技能的研讨和盯梢。”
涂鸦智能
据了解,全球化IoT开发渠道服务商涂鸦智能也行将推出智能家居和才智商业场景下的ChatGPT运用,并将于近期发布Demo。
涂鸦技能团队现已开始完结ChatGPT与自身AI模型的结合和拓宽,经过引进ChatGTP强壮的言语处理才能,进一步进步才智家庭和笔直职业的数字化水平。值得注意的是,涂鸦新运用后续或可接入谷歌发布的以LaMDA大模型为根底的Bard对话服务。
蓝色光标
蓝色光标在互动渠道表明,公司正在活跃试用ChatGPT技能,自有虚拟人苏小妹现已介入了AI多轮对话,AI作诗才能现已进入技能测验阶段,未来会结合AIGC和终端交互做更多数字化拓宽;一起,公司也在做其他ChatGPT产品的试用和调试。
科大讯飞
科大讯飞表明,ChatGPT首要涉及到自然言语处理相关技能,归于认知智能范畴的运用之一,公司在该方向技能和运用具有长时刻深沉的堆集。科大讯飞Al学习机将成为公司类ChatGPT技能首先落地的产品,并于本年5月发布。
奇安信
奇安信人工智能研讨院正依据ChatGPT相关技能和自身安全常识和数据,练习奇安信专有的类ChatGPT安全大模型。未来将广泛运用于安全产品开发、要挟检测等范畴。
江苏银行
该行已测验运用ChatGPT技能进步软件开发出产力,进一步进步科技运营效能。“从测验成果看,代码在出产环境运转,完美完结悉数需求且仅耗费了不到1小时,不只编写功用的时刻大大缩短,而且原先需求与厂商对接沟通耗费的时刻也由数天缩短到了数小时。”江苏银行信息科技部相关负责人表明。“未来的软件开发或许会开展成为AI编写、专人审阅的形式,完成出产力的大幅度腾跃。”
相关负责人表明,该行会将ChatGPT新技能进一步融入到日常工作、危险评价、客户服务、辅佐营销等范畴,更快满意客户在不同场景下的金融需求。

除了上述企业,像汉王、寺库、水滴公司、熵基科技、梦网科技、六合在线、佳创视讯、凡拓数创等也官宣了向ChatGPT发力的方案,可是更多的是蹭热门,并没有太多实质上的技能堆集。
打造本土化ChatGPT的必要性和可行性
李彦宏曾在2023年头的内部大会上谈论ChatGPT和AIGC:“技能能做到这一步了,可是它会变成什么样的产品,产品能满意什么样的需求,这个链条上还有许多不确定性。”
据国盛证券研报,在ChatGPT智能、顺滑的沟通体会背面,其有着多达1750亿个模型参数,OpenAI首要运用的公共爬虫数据集有着超越万亿单词的人类言语数据集。在算力方面,GPT-3.5在微软Azure AI超算根底设施(由英伟达V100 GPU 组成的高带宽集群)上进行练习,总算力耗费以每秒一千万亿次核算,约运转3640个整日。
本钱上小冰CEO李笛举了一个比方:若用ChatGPT的办法,以小冰结构当时支撑的对话交互量核算,每天本钱将高达3亿元,一年本钱超越1000亿元。

即使如此,业界仍是普遍以为国内也要有自己ChatGPT。不是炒概念,而是真实饯别相关技能,迭代模型。星图比特CEO 张炯以为我国打造自己的ChatGPT,有三个方面的必要性:
“第一是商场端,现在ChatGPT对国内用户不敞开,国内用户无法像海外用户相同为所欲为的运用,而从商场层面必定会有一个我国的ChatGPT呈现。第二是技能端,现在商场上可见的大模型(LLM)例如ChatGPT的根底模型GPT-3.5根本都是英语为母语练习的,中文基准的自然言语处理(NLP)的作用仍是稍逊于英语基准的,所以有个中文基准的模型呈现会进一步进步用户作用。第三是数据安全,AI的内容生本钱身是依据很多数据练习的成果,并OpenAI现已逐渐从一个公益性的项目向商场化改变,未来出于利益等要素或许存在不确定性,还有便是我国大陆要求一切的数据都是本地化保存,这点OpenAI在国内没有团队,数据的本地化保存和保护就很难到达监管要求。”

尤其是第三个方面,理论上讲,ChatGPT不会自动练习新数据,鉴于练习数据的进程,ChatGPT或许会答复带有种族歧视、性别歧视或其他不妥言辞,假设有人故意将ChatGPT这样的产品用在搅扰言论、挑动社会心情上,存在潜在的社会危险。
假设咱们没有自己的ChatGPT,就无法控制用来练习模型的数据的一切者和品种,无法在后续经过算法和练习数据进行纠正,很多虚伪数据的存在,也给常识产权和社会问题的追责带来了极高的难度。
未来假设AI技能大规模遍及,咱们跟国外AI大模型的代差拉大到不得不必的时分,那么在ChatGPT上也将面对相似芯片的卡脖子局势。为了不堕入被动局势,而且继续享用AI工业技能晋级带来的福利,国内自己打造ChatGPT很有必要。

关于我国自研类ChatGPT产品的发力难点,张炯告知动点科技:“现在我国大规模运用的谈天机器人与NLP的子使命相关,如机器翻译、智能客服、问答体系等。跟着LLM的开展,我国也将遍及依据LLM的AI谈天机器人。”
他以为我国自研的谈天机器人在运用上至少需求满意以下要求:首先在交互层面机器人需求适配中文习气的表达方法,也便是说要了解人类表达的指令。别的,在沟通阶段,为了到达无障碍沟通,机器人需求了解我国历史文化等相关的常识,而且运用我国言语风格和表达习气进行沟通,比方同一个词语在不同语境下表达不同的意思和情感。再者,谈天机器人需求依据我国的用户需求和社会现状供给个性化的服务,比方我国特有的付出方法、民族风俗等。
因为国内对AI技能尤其是大模型和相关芯片算力的出资规模以及底层技能还远不如美国,因而想要在短期内到达OpenAI的水平并不简单。
不过久远上看,国内有优异的算法工程师、一致的大商场、丰厚的运用场景和数据源,而且张炯也直言做好我国的ChatGPT并不是没有时机。“大数据方面我国走的很远,国内的各类场景信息化程度都很高,数据源丰厚,而且相关的工业链也完好。但模型方面就略显缺乏,现在像ChatGPT的根底GPT-3.5这样的都是大模型,大模型前期出资大、见效慢,在曾经对国内的出资者来说就不是优选的标的,所以只要少量大型互联网公司会参加,但出资也是有限的,开展缓慢。不过这也是时机,我信任ChatGPT这一波对国内的工业出资者也好,互联网公司也好都是警示,之后应该会迎来更大的投入。”