大模型的推理能力

引言 自 GPT3.5 引爆大模型概念以来,大家都期盼着 AGI1 的到来。但与此同时,当下各类大模型虽然依据 Scaling Law2,不断提升各方面的性能,但是关于模型的推理能力,总显得不足。 甚至科研界针对大模型究竟是否可能具有推理能力,也争论不休。例如下列近期比较热烈的讨论: ...

2024-11-06 · 9 分钟 · 癸老师