프로그램 사용/ai 프로그램

openai api 변경에 따른 llama.cpp / llama-swap 리포트 차이

구차니 2026. 6. 18. 12:38

그런데 208 이던 228 이던

client.chat.completions.create 함수를

client.responses.create 로 바꾸었더니 prompt speed / gen speed가 출력되지 않는다.

reasoning off 하기 위해서는 함수를 바꾸어야 하고. 바꾸면 리포트가 안되고 흐음..

걍 서버에서 끄고 해야하나? (llama-cli --reasoning off)