🌐 大模型从追赶时髦发展为真正实用,成为提效的关键手段。
**划重点:**站长之家(ChinaZ.com) 1月4日 消息:发表在《美国医学会儿科杂志》上的一项研究表明,ChatGPT-4在儿科医学病例的诊断方面的准确率仅为17%,较去年一般医学病例的39%更低。
站长之家(ChinaZ.com)1月4日 消息:斯坦福大学的研究人员利用维基百科数据训练了一个大模型,命名为WikiChat,通过优化和改进,成功解决了大模型的幻觉问题,并在事实准确性和其他指标上表现优秀。他们的最佳模型在新的基准测试中获得了97.3%的事实准确性,远远超过了GPT-4的66.1%。此外,WikiChat还在相关性、信息性、自然性、非重复性和时间正确性方面领先其他模型。
3、LLaVA在视觉聊天和推理问答方面表现出接近GPT-4水平的能力。