ai编程模型评测

  • gemini 2.5 pro-preview 非常聪明, 但是比较保守, agent能力差, 不会自己去找相关资料, 需要较强的prompt驱动
  • gpt 4.1 不笨, 会自己搜资料, 指令遵守能力强
  • 叫他维护文档会自己根据项目内代码修改
  • gpt 4o 比较笨, 很多错误
  • sonnet 3.7 很笨, 但agent能力很强, 经常瞎改东西