"상황에 따른 생각의 유연성은 효율성과 정확도를 오히려 향상시킨다"상황에 따른 생각을 구별하는 방법: Rain force Learning(보상 기존의 방법론들은 항상 추론 단계를 거친다는 것이 한계점이었다.그렇기 때문에 이 논문에서는 No-Thinking approach에서 영감을 받아 thinking process를 skip하고 pseudo-thinking process를 통해 바로 최종 응답을 생성하는 연구에 대해서 이야기를 합니다.pseudo-thinking process란?“”와 같이 prompt에 생각을 표현하는 것? No thinking이 단순한 문제에서는 오히려 thinking보다 더 좋은 퍼포먼스를 보여줄 수 있다. 이 논문에서 던진 첫번째 질문추론 모델은 입력 문제의 난이도에 따라 Thi..