文心一言,可能走岔了路
百度文心一言发布会之后,
离谱梗图已经人手一个了。
先问大家一个问题:
你觉得文心一言能干掉你的工作吗?
说到这儿是因为
最近看到了一个特别耸人听闻的结论,
OpenAI最新研究成果中指出,
美国至少有19%的工作岗位会被ChatGPT影响,
而且高薪高学历的岗位受到的影响要更大。
这个结论还挺反常识的。
作为一个长期关注科技板块的汽车媒体,
我们开始好奇号称“对标ChatGPT”的文心一言,
到底能不能干掉我们的工作。
所以我们加入了一些专业问题来测一测!
在这个过程中,却发现文心一言,可能走岔了路。
先来个简单点的问题,
“如何获得北京小汽车牌照?”
能看出主要靠搜集整理的封闭式问题,
文心一言还是能给出非常规整的回答。
那我们再来一个开放式的问题看看,
假设我现在有100万预算,想买3辆车,
它给出的购车建议是三辆“价格100万左右”的车,
没理解语义,价格也不对。
然后我们又问了一次,
这次终于推荐了三辆30多万的车,
X3,Q5,GLC,但这只是把预算简单粗暴劈成三份,
它显然没理解消费者问出这个问题,
是想在特定预算内兼顾到不同场景不同需求,
反正都不怎么智能。
这个太复杂?再换个简单明了的,
“2023年,造车新势力中谁会掉队”
这里文心一言给出了一个大概的分析框架,
但不会像人一样尝试“思考”,再得出结论,
哪怕是不成熟的结论,也没有。
包括“比亚迪和特斯拉到底
谁更成功”这种地图炮问题虽然分析框架有了,
但这个回答更像是用爬到的文章攒起来的,
没有体现它们的发展阶段和各自优势。
我又问它“EVO”和“STi”谁是史上最佳“JDM”车型
它显然是有点被绕迷糊了。
以至于出现了乱码。
看来对于专业人士的专业工作,
现在的文心一言确实搞定不了。
那我们再来看看它能否替代实习生。
要做好一个实习生,
逻辑思考能力、事实判断能力是最基础的。
我让它给我讲一下林黛玉倒拔垂杨柳的故事,
发现讲的挺好的,要不是知道林黛玉拔不动我还真信了。
让它生成一个Model Z的宣传片,
面对这个本来不存在的车和不成立的需求,
它一本正经的告诉我,Model Z是个皮卡。
最气人的还在后面,
我问它“我男朋友的女朋友应该叫我什么”
这个回答差点让我以为这件事很合理。
这么看,面对老板们千奇百怪的需求,
实习生们的工作,暂时也保住了。
这时可能会有很多人觉得,百度文心一言做的太草率。
可是测了更多问题之后,
我们有一种感觉,它可能是走岔路了。
不管是测试结果,还是百度的宣传口径,
文心一言突出一个“拥有全球最大的中文知识单元”,
但ChatGPT之所以能掀起AI浪潮,
是因为你恍惚之间会以为它是一个人类。
这种差异要追回到一个产品的技术路线和终极定义,
从ChatGPT-1,到GPT-4,
我们会发现它的迭代时间越来越短,
这是因为它是从构建数字生命的基本机制开始设计,
把所有语料掰开揉碎,给它足够长的时间,
逐渐做到自我生成表达。
而文心一言给人的感觉是,
它直出了很多互联网上原有的语料,
比如这个,一看就是爬的汽车之家。
它更像是一个加强版的搜索引擎,
而不是一个能推理、能理解上下文的LLM。
如果文心一言依然按现在的路径走下去,
不做判断,不下结论,
和ChatGPT之间的差距恐怕要越拉越大。
在这条突然白热化的赛道上,
选手们的焦虑已经从发布会现场溢出了屏幕,
但无论如何,路要一步一步走。
好了本期视频就到这里,
看高能科技锁定车云菌,
喜欢的话记得点赞关注一下,
我们下期再见。
免责声明:本文由用户上传,如有错误请指正,如有侵权,请联系删除!