消息说,OpenAI正忙着研究一种叫 BiDi 的双向语音模型,想让大家跟ChatGPT说话时别那么生分。要是咱们在AI还没说完话的时候插嘴,它就会马上调整回应,不会像现在那样突然卡壳。IT之家了解到,The Information 今天晚上爆料,OpenAI 正试图让大家跟ChatGPT的聊天变得更顺畅。原来的ChatGPT语音模式得咱们先说一句,AI听完才给反馈。要是咱们在它说话时插一句“好的”或者“嗯哼”,系统通常会直接给打断,根本接不上下一句。 他们正在搞的这个新模型BiDi(双向语音模型)能一直听着咱们说话,这样在被打断时就能马上调整内容。相比之下,老的模型一旦开始说就变不了了。这技术现在还没完全搞定呢。有个知情人士讲,测试的时候如果连续聊几分钟,模型很容易出问题,有时候听起来还挺别扭的。OpenAI 原来计划今年一季度就推 BiDi,现在看来可能得拖到二季度甚至更晚了。 大家觉得要是语音能力能赶上文字聊天,AI用起来就方便多了,毕竟大多数人还是更喜欢说话而不是打字。这模型用在客服上特好用。比如咱们跟商家的AI客服打电话,临时又想换个货不要退货了,BiDi就能让客服顺顺当当接着聊下去。 那知情人士还说,BiDi用起来挺灵活的。据IT之家知道的消息,OpenAI 之前说要专门为那款主要靠说话的AI设备升级语音功能,甚至还想弄个智能音箱,叫一声就能查邮件或者订服务。