요 며칠 GPT-5 Reasoning - High 를 사용해서 진지한 개발을 몇가지 해보고 있는데 진짜 레벨이 다르네요.

Claude가 잘한다고 생각하는 분들이 많은데, 뭐랄까, 좀 단순한 일을 Claude가 잘해서 그런 착시가 있는 것 같아요. GPT-5가 어려운 걸 진짜 잘합니다.

조금 전에 Codex랑 같이 심심풀이로 서버 코드 최적화를 진행했는데요. 생각지 못했던 방법으로 높은 수준의 최적화를 달성했습니다.

스타트업 시간 약 2.9배 속도 향상, 메모리 약 46.6% 절감이라는 엄청난 결과를..😳

저는 진짜 코드 한 줄을 안썼어요. 물론 휴먼 코드 리뷰를 한 번 하고 코드 정리는 해야겠지만, 직접 했으면 최소 며칠은 걸렸을 일..이 아니라 다른 일을 하느라 최적화는 생각도 못했을겁니다.

어느정도 최적화를 해두기도 했었고, 뭔가 더 최적화 할 수 있는 여지가 있을 것 같았지만, 기존에도 나쁘지는 않아서 그냥 냅두고 있었던거였거든요.

게다가 시간을 좀 써서 총 1,300만개 정도의 토큰을 썼는데, 비용이 약 $3.24 밖에 안합니다. 이정도 개선에 든 비용이 겨우 5천원..?! 😳

내년 정도가 되면 이런 최적화는 그냥 무한 루프로 돌려두면 알아서 계속 최적화하고 계선하겠죠? 비용도 거의 무료에 가까울테고요.

개발을 잘 한다는 것이 무엇인지를 개인과 회사 차원에서 진지하게 다시 고민해봐야 할 것 같습니다.

요 며칠 GPT-5 Reasoning - High 를 사용해서 진지한 개발을 몇가지 해보고 있는데 진짜 레벨이 다르네요. Claude가 잘한다고 생각하는 분들이 많은데, 뭐랄까, 좀 단순한 일을 Claude가 잘해서 그런 착시가 있는 것 같아요. GPT-5가 어려운 걸 진짜 잘합니다. 조금 전에 Codex랑 같이 심심풀이로 서버 코드 최적화를 진행했는데요. 생각지 못했던 방법으로 높은 수준의 최적화를 달성했습니다. 스타트업 시간 약 2.9배 속도 향상, 메모리 약 46.6% 절감이라는 엄청난 결과를..😳 저는 진짜 코드 한 줄을 안썼어요. 물론 휴먼 코드 리뷰를 한 번 하고 코드 정리는 해야겠지만, 직접 했으면 최소 며칠은 걸렸을 일..이 아니라 다른 일을 하느라 최적화는 생각도 못했을겁니다. 어느정도 최적화를 해두기도 했었고, 뭔가 더 최적화 할 수 있는 여지가 있을 것 같았지만, 기존에도 나쁘지는 않아서 그냥 냅두고 있었던거였거든요. 게다가 시간을 좀 써서 총 1,300만개 정도의 토큰을 썼는데, 비용이 약 $3.24 밖에 안합니다. 이정도 개선에 든 비용이 겨우 5천원..?! 😳 내년 정도가 되면 이런 최적화는 그냥 무한 루프로 돌려두면 알아서 계속 최적화하고 계선하겠죠? 비용도 거의 무료에 가까울테고요. 개발을 잘 한다는 것이 무엇인지를 개인과 회사 차원에서 진지하게 다시 고민해봐야 할 것 같습니다.

일반적인 커뮤니티나 쇼핑몰 수준의 서비스는, 캐시 없이도 16vCPU/64GB 다섯대 정도면 MAU 100만 정도를 단순한 페일오버까지 고려하여 커버할 수 있다. 이 정도만으로도 튜닝이 잘 되어 있다면 꽤 여유로울 것.

일반적인 커뮤니티나 쇼핑몰 수준의 서비스는, 캐시 없이도 16vCPU/64GB 다섯대 정도면 MAU 100만 정도를 단순한 페일오버까지 고려하여 커버할 수 있다. 이 정도만으로도 튜닝이 잘 되어 있다면 꽤 여유로울 것.

‎나만의 대한민국 여행 지도를 만들어보세요!

내가 가본 우리나라는 여러분이 방문한 한국의 모든 지역을 색칠하는 여행 기록 앱이에요.
제가 쓰려고 만들었어요. 죽기 전에 다 색칠하는 게 제 소원이에요. 광고나 결제 따윈 없으니 안심하고 사용하세요.

* 지역별 색칠 기능
- 방문한 시/군/구를 터치 한 번으로 색칠
- 직관적인 터치 인터페이스

* 여행 통계 한눈에
- 전국 방문율 실시간 확인
- 지역별 방문 현황 통계

* 도전 과제, 성취감
- 전국 완주 도전
- 지역별 컬렉션 완성
- 특별한 여행 기록 달성

* 간편한 사용
-…

‎색칠 지도 - 내가 가본 우리나라

내가 가본 우리나라.
웹서비스에 이어... 아이폰 앱과 안드로이드 앱까지 모두 출시했습니다.

여행 중에 짬짬히 작업해서 웹, 안드로이드, 아이폰까지 출시하다니...
AI 코딩 시대가 좋긴 좋습니다.


기술 스택은 Ruby on Rails + Flutter 로 만들었습니다.
Rails 의 기본 기능을 활용해 거의 90% 를 만들었고, Flutter 로 감싸는 부분이 나머지 10% 정도 인 것 같네요.


AI 때문에 좋아진 것도 맞지만, 웹/앱 만드는 기술들이 예전보다 훨씬 좋아져서 이렇게 혼자서도 웹과 앱을 뚝딱 낼 수 있는 세상이 된 것 같아요.

광고도 없고, 완전히 무료로 사용할 수 있게 만들었어요.
국내 여행 좋아하시는 분들이라면 아마 좋아하실 겁니다.


https://apps.apple.com/kr/app/%EC%83%89%EC%B9%A0-%EC%A7%80%EB%8F%84-%EB%82%B4%EA%B0%80-%EA%B0%80%EB%B3%B8-%EC%9A%B0%EB%A6%AC%EB%82%98%EB%9D%BC/id6749817480

내가 가본 우리나라.웹서비스에 이어... 아이폰 앱과 안드로이드 앱까지 모두 출시했습니다. 여행 중에 짬짬히 작업해서 웹, 안드로이드, 아이폰까지 출시하다니... AI 코딩 시대가 좋긴 좋습니다. 기술 스택은 Ruby on Rails + Flutter 로 만들었습니다.Rails 의 기본 기능을 활용해 거의 90% 를 만들었고, Flutter 로 감싸는 부분이 나머지 10% 정도 인 것 같네요. AI 때문에 좋아진 것도 맞지만, 웹/앱 만드는 기술들이 예전보다 훨씬 좋아져서 이렇게 혼자서도 웹과 앱을 뚝딱 낼 수 있는 세상이 된 것 같아요. 광고도 없고, 완전히 무료로 사용할 수 있게 만들었어요. 국내 여행 좋아하시는 분들이라면 아마 좋아하실 겁니다. https://apps.apple.com/kr/app/%EC%83%89%EC%B9%A0-%EC%A7%80%EB%8F%84-%EB%82%B4%EA%B0%80-%EA%B0%80%EB%B3%B8-%EC%9A%B0%EB%A6%AC%EB%82%98%EB%9D%BC/id6749817480

App Store

내가 가본 우리나라

나는 ChatGPT가 나오기 전부터, Copilot이 출시된 직후부터 코딩에 AI를 본격적으로 사용해왔는데, 작년말과 올초에 현타를 좀 맞았었다. 재밌는건 지가 다 하고, 재미 없는 것만 내가 하네? 이런 느낌.. 🫠

그런데 최근에 코딩 AI의 성능이 급격하게 좋아지고, 에이전트 형식의 코딩 AI가 어느정도 쓸만해진 뒤로 다시 조금 재밌어지기 시작했다.

마음가짐의 변화도 있었지만, 뭐랄까.. 기억은 잘 안나지만 처음 코딩을 시작했을 때 두근거리며 코딩을 즐기던 그런 마음이든다랄까?

뭔가.. 8bit 컴퓨터 시절 고도의 기계를 저수준 언어로 통제해냈다는 느낌? 블랙박스인 서버를 해킹하는 느낌? 내가 못하던 것을 해 낼때의 짜릿함? 그런 것에서 도파민이 뿜뿜하는 듯.

그래서 요즘에 일하기 싫을 때 오히려 어려운 것들을 시켜보는 재미로 AI를 가지고 놀고 있는데, 점점 더 어려운 것을 시켜보면서 한계를 파악해보는 재미가 쏠쏠하다.

나는 ChatGPT가 나오기 전부터, Copilot이 출시된 직후부터 코딩에 AI를 본격적으로 사용해왔는데, 작년말과 올초에 현타를 좀 맞았었다. 재밌는건 지가 다 하고, 재미 없는 것만 내가 하네? 이런 느낌.. 🫠 그런데 최근에 코딩 AI의 성능이 급격하게 좋아지고, 에이전트 형식의 코딩 AI가 어느정도 쓸만해진 뒤로 다시 조금 재밌어지기 시작했다. 마음가짐의 변화도 있었지만, 뭐랄까.. 기억은 잘 안나지만 처음 코딩을 시작했을 때 두근거리며 코딩을 즐기던 그런 마음이든다랄까? 뭔가.. 8bit 컴퓨터 시절 고도의 기계를 저수준 언어로 통제해냈다는 느낌? 블랙박스인 서버를 해킹하는 느낌? 내가 못하던 것을 해 낼때의 짜릿함? 그런 것에서 도파민이 뿜뿜하는 듯. 그래서 요즘에 일하기 싫을 때 오히려 어려운 것들을 시켜보는 재미로 AI를 가지고 놀고 있는데, 점점 더 어려운 것을 시켜보면서 한계를 파악해보는 재미가 쏠쏠하다.

“이 문제는 왜 해결해야 하죠?”
토스페이먼츠의 Product Manager는 늘 이 질문에서 시작합니다.

“무엇을 만들까”보다 “왜 해야 하나요?”를 묻는 사람들, 토스페이먼츠 PM

글을 읽다가 공감한 부분이 있었다. 프로덕트 매니저는 기획서를 쓰거나 화면을 그리는 사람이 아니라, 문제의 본질을 정의하고 해결까지 이끄는 사람이라는 대목이다. 겉으로 드러난 현상이 아니라, 그 뒤에 숨어 있는 원인을 찾아내고 본질을 묻는 것. 나도 이것이야말로 프로덕트 매니저의 핵심 역할이라고 생각한다.

문제가 선명해지면, 디자이너와 엔지니어의 움직임이 달라진다. 우리가 "무슨 문제를 풀어야 하고, 왜 풀어야 하는지"에 공감하게 되면, 각자는 자신의 전문성을 바탕으로 해결을 위한 수단을 찾아낸다. 디자이너는 사용자 경험과 디자인 요소로, 엔지니어는 기술적 방법으로 문제를 해결한다.

흥미로운 건, 이 과정에서 흔히 기획이라고 부르는 요소들—어떤 화면을 구성할지, 어떤 흐름으로 작동할지—는 억지로 끌어내지 않아도 자연스럽게 해결된다는 점이다. 문제를 제대로 정의했을 때, 팀은 이미 같은 그림을 그리기 시작하기 때문이다.

물론 모든 조직이 이렇게 작동하지는 않는다. 하지만 제품 중심으로 일하는 팀이라면 반드시 이런 구조가 필요하다. 프로덕트 매니저가 문제의 본질을 정의하고, 디자이너와 엔지니어가 그 문제에 몰입하며 각자의 도구로 해답을 만들어내는 팀워크. 나는 이것이 제품을 앞으로 나아가게 하는 가장 건강한 방식이라고 생각한다.

https://toss.im/career/article/tosspayments_pm

글을 읽다가 공감한 부분이 있었다. 프로덕트 매니저는 기획서를 쓰거나 화면을 그리는 사람이 아니라, 문제의 본질을 정의하고 해결까지 이끄는 사람이라는 대목이다. 겉으로 드러난 현상이 아니라, 그 뒤에 숨어 있는 원인을 찾아내고 본질을 묻는 것. 나도 이것이야말로 프로덕트 매니저의 핵심 역할이라고 생각한다. 문제가 선명해지면, 디자이너와 엔지니어의 움직임이 달라진다. 우리가 "무슨 문제를 풀어야 하고, 왜 풀어야 하는지"에 공감하게 되면, 각자는 자신의 전문성을 바탕으로 해결을 위한 수단을 찾아낸다. 디자이너는 사용자 경험과 디자인 요소로, 엔지니어는 기술적 방법으로 문제를 해결한다. 흥미로운 건, 이 과정에서 흔히 기획이라고 부르는 요소들—어떤 화면을 구성할지, 어떤 흐름으로 작동할지—는 억지로 끌어내지 않아도 자연스럽게 해결된다는 점이다. 문제를 제대로 정의했을 때, 팀은 이미 같은 그림을 그리기 시작하기 때문이다. 물론 모든 조직이 이렇게 작동하지는 않는다. 하지만 제품 중심으로 일하는 팀이라면 반드시 이런 구조가 필요하다. 프로덕트 매니저가 문제의 본질을 정의하고, 디자이너와 엔지니어가 그 문제에 몰입하며 각자의 도구로 해답을 만들어내는 팀워크. 나는 이것이 제품을 앞으로 나아가게 하는 가장 건강한 방식이라고 생각한다. https://toss.im/career/article/tosspayments_pm

toss.im

PM이 이런 것까지 해요?

AI 코딩 도우미 초기에는, 프론트는 되겠지만 백엔드는 안되겠는데 하는 분들이 많았고, 나는 그렇진 않을 것 같은데..라며 소심히 말하고 다녔는데, 오늘 기준으로, 현재 진행하는 프로젝트 한정으로는 백엔드가에 더 도움이 되고 있다.

AI 코딩 도우미 초기에는, 프론트는 되겠지만 백엔드는 안되겠는데 하는 분들이 많았고, 나는 그렇진 않을 것 같은데..라며 소심히 말하고 다녔는데, 오늘 기준으로, 현재 진행하는 프로젝트 한정으로는 백엔드가에 더 도움이 되고 있다.

오늘 개발하다가 크래시 되는 버그가 있어서 AI 친구들이랑 한참을 낑낑댔는데, GPT고 Claude고 몇 번을 시도하고 범위를 좁혀줘도 못찾았다.

근데 나 역시도 아무리 코드를 들여다봐도 원인을 알 수가 없었는데, 결국은 한 줄 한 줄, 키워드 하나 하나 삭제하는 방법으로 해결했다.

그런걸보면 음.. 이제 AI 대비해서 인간이 우위인 일은 역시 노가다(물리) 뿐인 것인가.. 🥲😇

오늘 개발하다가 크래시 되는 버그가 있어서 AI 친구들이랑 한참을 낑낑댔는데, GPT고 Claude고 몇 번을 시도하고 범위를 좁혀줘도 못찾았다. 근데 나 역시도 아무리 코드를 들여다봐도 원인을 알 수가 없었는데, 결국은 한 줄 한 줄, 키워드 하나 하나 삭제하는 방법으로 해결했다. 그런걸보면 음.. 이제 AI 대비해서 인간이 우위인 일은 역시 노가다(물리) 뿐인 것인가.. 🥲😇

이 글에 대한 질문이 많아서 답변드립니다

Q. 뭘로 쓰세요?
A. Codex CLI로 사용합니다.

Q. Gemini나 Grok은 어떤가요?
A. (어휴..)

Q. 어떻게 지시하셨나요?
A. 최적화 해야 하는 목적과 포인트를 몇 개 알려주고 분석해보라고 함 → 같이 여러 아이디어를 탐색하다가 좋은 아이디어가 있으면 그 아이디어를 구현해보라고 함 → 코드를 살펴보고 개선점을 제시함 → 수정 후 벤치마크 → (반복)

개선 포인트를 알려주고 같이 탐색하긴 했지만, 최종 아이디어는 GPT의 아이디어를 채택했습니다. 컨텍스트를 거의 다 소진할 정도로 긴 토론을 거쳤고요.

코드는 진짜로 제가 한 줄도 쓰진 않고 말로만 지시했습니다만, 검토 후 문제가 있거나 적절하지 않은 코드는 수정하라고 지시하는 과정을 거쳤습니다.

즉, 어느정도는 알아야 지시 할 수 있긴 하고요. 알아서 최적화를 한다고 해도, 그 방법이나 결과가 적합한, 제대로 된 결과인지는 알아야 시킬 수 있습니다. 앞으로도 그렇겠죠.

그리고 무엇보다 어려운 문제를 생각해내고 정의 할 수 있어야 높은 가치를 이끌어 낼 수 있겠죠.

보통은 눈에 쉽게 보이는 표면적인 일만 시키니까 그 진가를 알아채지 못하시는 것 같습니다.

이 글에 대한 질문이 많아서 답변드립니다 Q. 뭘로 쓰세요?A. Codex CLI로 사용합니다. Q. Gemini나 Grok은 어떤가요?A. (어휴..) Q. 어떻게 지시하셨나요?A. 최적화 해야 하는 목적과 포인트를 몇 개 알려주고 분석해보라고 함 → 같이 여러 아이디어를 탐색하다가 좋은 아이디어가 있으면 그 아이디어를 구현해보라고 함 → 코드를 살펴보고 개선점을 제시함 → 수정 후 벤치마크 → (반복) 개선 포인트를 알려주고 같이 탐색하긴 했지만, 최종 아이디어는 GPT의 아이디어를 채택했습니다. 컨텍스트를 거의 다 소진할 정도로 긴 토론을 거쳤고요. 코드는 진짜로 제가 한 줄도 쓰진 않고 말로만 지시했습니다만, 검토 후 문제가 있거나 적절하지 않은 코드는 수정하라고 지시하는 과정을 거쳤습니다. 즉, 어느정도는 알아야 지시 할 수 있긴 하고요. 알아서 최적화를 한다고 해도, 그 방법이나 결과가 적합한, 제대로 된 결과인지는 알아야 시킬 수 있습니다. 앞으로도 그렇겠죠. 그리고 무엇보다 어려운 문제를 생각해내고 정의 할 수 있어야 높은 가치를 이끌어 낼 수 있겠죠. 보통은 눈에 쉽게 보이는 표면적인 일만 시키니까 그 진가를 알아채지 못하시는 것 같습니다.

며칠 전 공개했던 내가 가본 우리나라 웹사이트를 앱으로도 만들어봤습니다. 안드로이드, 아이폰 그리고 맥 앱까지. (맥은 아직 심사 중이에요)

내가 가본 우리나라 앱 개발 뒷 이야기

며칠 전 공개했던 내가 가본 우리나라 웹사이트를 앱으로도 만들어봤습니다.
안드로이드, 아이폰 그리고 맥 앱까지. (맥은 아직 심사 중이에요)

간단한 아이디어였고 제가 쓰고 싶은 마음에 만들기도 했지만,
레일즈 8을 좀 더 알아보고자 하는 마음.
제 기술 스택을 정돈해 보고 싶은 마음이 있었어요.

루비 온 레일즈, Vue.js, React
플러터, React Native, Universal Windows Platform

계속 이렇게 공부만 하면서 왔다 갔다 해야 하나?
좀 잘 정리해서 내 주력 스택을 확정시킬 순 없을까?

루비 온 레일즈 8의 기본 기능을 최대한 활용해 보고 싶었습니다.

* Hotwire, Stimulus, Turbo, importmap을 통한 외부 종속성 없는 자바스크립트 환경.
* Kamal 을 통한 배포.
* Solid Queue를 통한 백그라운드 작업.
* Solid Cache 캐싱.
* sqlite와 홈서버로 프로덕션 환경 운영해 보기.
* Hotwire Native를 통한 모바일 앱 개발까지.

웹사이트를 다 만들고 나서 아주 홀가분했습니다. Hotwire에 대해 거의 아는 게 없었지만 AI 덕분에 수월했어요.
React 같은 걸 쓸 필요가 있나? 하는 생각을 많이 했습니다. Webpack이나 Vite 같은 피곤한 도구들 안 봐도 되는 것도 정말 좋았고요.

모바일 앱을 만들기 위해 Hotwire Native와 이틀 정도 씨름하다가…
이건 도저히 안 되겠다. 더러워서 못 해먹겠다 하고 포기했습니다.

결국 플러터를 선택해서 안드로이드, 아이폰, 맥 앱을 만들었습니다.
총 코드는 90% 정도가 레일즈이고 10% 정도가 플러터.

클로드 코드로만 작업했고, 제가 직접 코드에 관여한 부분은 없었던 것 같아요.
클로드 코드를 사용할 때는 여러 작업을 병렬로 안 하고 최대한 순차적으로 진행하려고 노력했습니다.
다른 프로젝트도 신경 쓰지 않고요. 안 그러면 제 머리가 따라갈 수 없어서.
여담이지만 저는 클로드 코드에 mcp도 하나도 연결하지 않았고, 남들이 만든 agents.md 같은 것들도 잘 보지 않습니다. 노땅이 다 된 것 같아요.

규모가 작은 앱이긴 하지만, 이번 작업으로 이 스택에 자신감이 생겼습니다.
앞으로도 새로운 서비스 만들 땐 이렇게 만들지 않을까 싶습니다. 😁


https://jeho.page/essay/2025/08/27/my-korea-map.html

며칠 전 공개했던 내가 가본 우리나라 웹사이트를 앱으로도 만들어봤습니다. 안드로이드, 아이폰 그리고 맥 앱까지. (맥은 아직 심사 중이에요) 간단한 아이디어였고 제가 쓰고 싶은 마음에 만들기도 했지만, 레일즈 8을 좀 더 알아보고자 하는 마음. 제 기술 스택을 정돈해 보고 싶은 마음이 있었어요. 루비 온 레일즈, Vue.js, React 플러터, React Native, Universal Windows Platform 계속 이렇게 공부만 하면서 왔다 갔다 해야 하나? 좀 잘 정리해서 내 주력 스택을 확정시킬 순 없을까? 루비 온 레일즈 8의 기본 기능을 최대한 활용해 보고 싶었습니다. * Hotwire, Stimulus, Turbo, importmap을 통한 외부 종속성 없는 자바스크립트 환경. * Kamal 을 통한 배포. * Solid Queue를 통한 백그라운드 작업. * Solid Cache 캐싱. * sqlite와 홈서버로 프로덕션 환경 운영해 보기. * Hotwire Native를 통한 모바일 앱 개발까지. 웹사이트를 다 만들고 나서 아주 홀가분했습니다. Hotwire에 대해 거의 아는 게 없었지만 AI 덕분에 수월했어요. React 같은 걸 쓸 필요가 있나? 하는 생각을 많이 했습니다. Webpack이나 Vite 같은 피곤한 도구들 안 봐도 되는 것도 정말 좋았고요. 모바일 앱을 만들기 위해 Hotwire Native와 이틀 정도 씨름하다가… 이건 도저히 안 되겠다. 더러워서 못 해먹겠다 하고 포기했습니다. 결국 플러터를 선택해서 안드로이드, 아이폰, 맥 앱을 만들었습니다. 총 코드는 90% 정도가 레일즈이고 10% 정도가 플러터. 클로드 코드로만 작업했고, 제가 직접 코드에 관여한 부분은 없었던 것 같아요. 클로드 코드를 사용할 때는 여러 작업을 병렬로 안 하고 최대한 순차적으로 진행하려고 노력했습니다. 다른 프로젝트도 신경 쓰지 않고요. 안 그러면 제 머리가 따라갈 수 없어서. 여담이지만 저는 클로드 코드에 mcp도 하나도 연결하지 않았고, 남들이 만든 agents.md 같은 것들도 잘 보지 않습니다. 노땅이 다 된 것 같아요. 규모가 작은 앱이긴 하지만, 이번 작업으로 이 스택에 자신감이 생겼습니다. 앞으로도 새로운 서비스 만들 땐 이렇게 만들지 않을까 싶습니다. 😁 https://jeho.page/essay/2025/08/27/my-korea-map.html

K리그 프로그래머

내가 꼽는 소프트웨어 개발자 필독서 Top 3 중 하나.

AI가 구현(코딩)을 대신해주는 시대이기에 소프트웨어 개발자라면 더욱 필수적으로 읽어야 할 책이 아닐지.

하지만 10년 뒤에는 코딩이라는 행위가 정말로 로스트 테크놀로지 같은 느낌이 될 수도 있을 것 같아, 한 번 더 읽어보기로했다.

내가 꼽는 소프트웨어 개발자 필독서 Top 3 중 하나. AI가 구현(코딩)을 대신해주는 시대이기에 소프트웨어 개발자라면 더욱 필수적으로 읽어야 할 책이 아닐지. 하지만 10년 뒤에는 코딩이라는 행위가 정말로 로스트 테크놀로지 같은 느낌이 될 수도 있을 것 같아, 한 번 더 읽어보기로했다.

나머지 책들도 알려달라고 하셔서 적어봅니다.

소프트웨어 개발자 필독서 Top 3

1️⃣ The C Programming Language

컴퓨터 프로그래밍의 근본 (주니어)

2️⃣ Code Complete

소프트웨어 개발의 모든 것 (주니어, 미드)

3️⃣ 구글 엔지니어는 이렇게 일한다

개발 협업에 대한 모든 것 (미드, 시니어)

—

자매품, 소프트웨어 개발자를 위한 AI 필독서

📘 3분 딥러닝 텐서플로맛

📕 최고의 프롬프트 엔지니어링 강의

이상한 것이 끼어있는 것 같지만 착각입니다.

요 며칠 GPT-5 Reasoning - High 를 사용해서 진

요즘 직업과 돈에 대해 깊이 생각하게 됩니다. 회사를 떠나 홀로서기를 했을 때 과연 생계를 유지할 수 있을지 고민되기 때문입니다. 안타까운 것은 아무리 고민해도 명확한 답이 나오지 않는다는 점입니다. 시뮬레이션은 가정에 불과하고, 현실과 미래는 예측할 수 없으니까요. 저와 같은 생각을 하는 많은 분들이 비슷한 딜레마에 빠져 있을 것입니다. 나가야 할까, 머물러야 할까. 마치 죽느냐 사느냐의 기로에 선 것 같습니다.


생계는 곧 생명입니다. 특히 가정이 있는 사람들에게 생계는 가족의 생명과 직결됩니다. 그래서 자연스럽게 더 많은 돈을 벌 수 있는 직업을 떠올리게 됩니다. 돈을 벌 수 없는 일은 선택하기 어렵죠. 최소한 먹고살 만큼은 벌어야 직업으로서 의미가 있으니까요.
결국 행복하지 않더라도 돈을 벌기 위해 일을 선택해야 합니다. 행복해지려고 사는데, 이보다 큰 아이러니가 또 있을까요?


어쩌면 우리에게 필요한 것은 확신이라는 생각이 듭니다. 알 수 없는 미래를 향한 확신만 있다면 무엇이든 과감하게 도전할 수 있을 테니까요.
 * 먹고살 만큼 돈을 벌 수 있다면
 * 진짜 행복한 나날을 보낼 수 있다면
 * 일을 통해 세상에 선한 영향력을 줄 수 있다면
이런 확신이 있다면 과감히 도전할 수 있을 것입니다. 하지만 믿음이 어렵습니다. 자신에 대한 확신과 미래에 대한 믿음을 갖기가 쉽지 않습니다.


그래서 현재를 기준으로 열심히 계산해봅니다. 이렇게 하면 얼마, 저렇게 하면 어떤 결과가 나올지, 지금 가진 것을 포기하면 얼마나 힘들어질지 따져봅니다. 당연히 해야 하는 생각이고, 충분히 고려해야 할 부분입니다.
하지만 그런 계산으로는 결국 선택할 수 없다는 것도 알고 있습니다. 미래는 계산으로 도전하는 것이 아니라, 해보지 않은 일에 더 열심히 부딪혀 돌파해 나가는 것임을 잘 알고 있으니까요.


어쩌면 지금보다 더 열심히 살 자신이 없는 것일 수도 있습니다. 어쩌면 지금보다 더 힘든 도전이 두려워 망설이는 것일 수도 있고요. 힘든 것은 싫으니까, 지금처럼 고정적으로 수입이 나오고 매일 출근할 곳이 있다는 안도감에 머무르고 싶은 것이겠죠.
언제 그만둬도 이상하지 않을, 내가 아니어도 충분히 잘 돌아갈 그런 곳에서 편안히 머물고 싶은 마음일 수도 있습니다.


무엇이 내 삶에 확신이 되는지 자신에게 물어봅시다. 그리고 과연 나는 행복하기 위해 어떤 노력을 하고 있는지 확인해봅시다. 행복하려고 노력하지 않고 있다면, 어떤 방해 요소가 있는지 찾아봅시다. 그리고 오늘 그 장애물을 빠르게 치워봅시다.
돈과 명예는 진정한 확신의 근거가 될 수 없습니다. 오직 행복하기 위한 조건만이 진정한 확신의 바탕이 될 수 있다는 것을 깨닫는 우리가 되길 진심으로 응원합니다.

﻿요즘 직업과 돈에 대해 깊이 생각하게 됩니다. 회사를 떠나 홀로서기를 했을 때 과연 생계를 유지할 수 있을지 고민되기 때문입니다. 안타까운 것은 아무리 고민해도 명확한 답이 나오지 않는다는 점입니다. 시뮬레이션은 가정에 불과하고, 현실과 미래는 예측할 수 없으니까요. 저와 같은 생각을 하는 많은 분들이 비슷한 딜레마에 빠져 있을 것입니다. 나가야 할까, 머물러야 할까. 마치 죽느냐 사느냐의 기로에 선 것 같습니다. 생계는 곧 생명입니다. 특히 가정이 있는 사람들에게 생계는 가족의 생명과 직결됩니다. 그래서 자연스럽게 더 많은 돈을 벌 수 있는 직업을 떠올리게 됩니다. 돈을 벌 수 없는 일은 선택하기 어렵죠. 최소한 먹고살 만큼은 벌어야 직업으로서 의미가 있으니까요.결국 행복하지 않더라도 돈을 벌기 위해 일을 선택해야 합니다. 행복해지려고 사는데, 이보다 큰 아이러니가 또 있을까요? 어쩌면 우리에게 필요한 것은 확신이라는 생각이 듭니다. 알 수 없는 미래를 향한 확신만 있다면 무엇이든 과감하게 도전할 수 있을 테니까요.<ul ><li>먹고살 만큼 돈을 벌 수 있다면</li><li>진짜 행복한 나날을 보낼 수 있다면</li><li>일을 통해 세상에 선한 영향력을 줄 수 있다면</li></ul>이런 확신이 있다면 과감히 도전할 수 있을 것입니다. 하지만 믿음이 어렵습니다. 자신에 대한 확신과 미래에 대한 믿음을 갖기가 쉽지 않습니다. 그래서 현재를 기준으로 열심히 계산해봅니다. 이렇게 하면 얼마, 저렇게 하면 어떤 결과가 나올지, 지금 가진 것을 포기하면 얼마나 힘들어질지 따져봅니다. 당연히 해야 하는 생각이고, 충분히 고려해야 할 부분입니다.하지만 그런 계산으로는 결국 선택할 수 없다는 것도 알고 있습니다. 미래는 계산으로 도전하는 것이 아니라, 해보지 않은 일에 더 열심히 부딪혀 돌파해 나가는 것임을 잘 알고 있으니까요. 어쩌면 지금보다 더 열심히 살 자신이 없는 것일 수도 있습니다. 어쩌면 지금보다 더 힘든 도전이 두려워 망설이는 것일 수도 있고요. 힘든 것은 싫으니까, 지금처럼 고정적으로 수입이 나오고 매일 출근할 곳이 있다는 안도감에 머무르고 싶은 것이겠죠.언제 그만둬도 이상하지 않을, 내가 아니어도 충분히 잘 돌아갈 그런 곳에서 편안히 머물고 싶은 마음일 수도 있습니다. 무엇이 내 삶에 확신이 되는지 자신에게 물어봅시다. 그리고 과연 나는 행복하기 위해 어떤 노력을 하고 있는지 확인해봅시다. 행복하려고 노력하지 않고 있다면, 어떤 방해 요소가 있는지 찾아봅시다. 그리고 오늘 그 장애물을 빠르게 치워봅시다.돈과 명예는 진정한 확신의 근거가 될 수 없습니다. 오직 행복하기 위한 조건만이 진정한 확신의 바탕이 될 수 있다는 것을 깨닫는 우리가 되길 진심으로 응원합니다.﻿

확신은 어디에서 오는가?

90%의 기획자들이 빠져있는 문제 

필터 프로블럼(Filter problem)은 무엇인가

매우 공감하는 글. 좀 더 첨언해보자면,

- 문제가 뭔지 정의하고 그에 대한 솔루션을 만들기보다, 머릿속 솔루션(이라기보단 개발 아이디어)을 꺼낸다음 문제를 역으로 정의해서 끼워 맞추려는 경우도 자주 발견할 수 있음

- 문제가 무엇인지 발견하고 정의하는 일이 어려울 때 가장 많이 선택하는 가설 패턴은, ‘OO의 부재로 GMV가 낮다‘ -> ’OO 하면 GMV가 상승할 것‘

- OO 를 런칭한 후 GMV가 상승하지 않으면 기획이 실패한 것이 되므로(가설 입증 여부는 이미 관심이 없는 상태), 성공해야만 함

- 실패했다면 실패한대로, 성공했다면 성공한대로 GMV 올려줄 것 같은 다음 솔루션을 머릿속에서 또 꺼낸 다음, GMV가 상승하는지 또 실험함

이쯤 되면, ‘문제’나 ’가설‘은 온데간데 없고 GMV 상승 아이디어 맞추기 게임이 되어버림. 모든 실험의 성공지표는 GMV로 통일되고, 가설입증을 위한 지표를 살펴야 한다는 의견은 무시당해버림 - GMV 가 오르면 되지, 다른 지표가 왜 중요한데! 라는 태도로 나타남.

비즈니스에서 GMV는 당연히 중요하지만, 그 GMV 를 ‘어떻게’ 확보할 것인지에 대한 전략이 부재한 기업 또는 이를 이해하지 못하는 사람들에게서 나타나는 특징.

매우 공감하는 글. 좀 더 첨언해보자면, - 문제가 뭔지 정의하고 그에 대한 솔루션을 만들기보다, 머릿속 솔루션(이라기보단 개발 아이디어)을 꺼낸다음 문제를 역으로 정의해서 끼워 맞추려는 경우도 자주 발견할 수 있음 - 문제가 무엇인지 발견하고 정의하는 일이 어려울 때 가장 많이 선택하는 가설 패턴은, ‘OO의 부재로 GMV가 낮다‘ -&gt; ’OO 하면 GMV가 상승할 것‘ - OO 를 런칭한 후 GMV가 상승하지 않으면 기획이 실패한 것이 되므로(가설 입증 여부는 이미 관심이 없는 상태), 성공해야만 함 - 실패했다면 실패한대로, 성공했다면 성공한대로 GMV 올려줄 것 같은 다음 솔루션을 머릿속에서 또 꺼낸 다음, GMV가 상승하는지 또 실험함 이쯤 되면, ‘문제’나 ’가설‘은 온데간데 없고 GMV 상승 아이디어 맞추기 게임이 되어버림. 모든 실험의 성공지표는 GMV로 통일되고, 가설입증을 위한 지표를 살펴야 한다는 의견은 무시당해버림 - GMV 가 오르면 되지, 다른 지표가 왜 중요한데! 라는 태도로 나타남. 비즈니스에서 GMV는 당연히 중요하지만, 그 GMV 를 ‘어떻게’ 확보할 것인지에 대한 전략이 부재한 기업 또는 이를 이해하지 못하는 사람들에게서 나타나는 특징.

takyoh.com

매우 공감하는 글. 좀 더 첨언해보자면,

- 문제가 뭔지 정의하

1. 모른다는 말은 알려고 노력하지 않기 위한 구실이자 핑계다.

2. 문제에서 당장 답을 찾고 지름길로 가려고 하지마라. 이런 손쉬운 길은 각자의 잠재력을 방해한다.

3. ’모른다‘라는 말이 입 밖에 나올 때 무슨 일이 벌어지는지 아는가? 뇌가 더 알려고 하지 않는다.

4. 인간은 본래 알아채고 적응하고 행동하고 반복하는 존재다. 무언가를 알아채도록 타고났는데 답을 찾으려고 애쓰지 않는다면, 삶을 변화시킬 중요한 순간을 스스로 가로막는 일이다.

5. 따라서 이런 중요한 순간에 마음을 열어두려면, ”모른다“라고 말할 때마다 깨닫고 당장 다른 말로 바꿔야 한다.

6. 디즈니랜드의 신입 직원은 손님들에게 ”모른다“라고 답하지 않고 대신 ”제가 알아보겠습니다“라고 답한 뒤 실제로 알아보도록 교육받는다.


#예술가의해법

1. 모른다는 말은 알려고 노력하지 않기 위한 구실이자 핑계다. ​2. 문제에서 당장 답을 찾고 지름길로 가려고 하지마라. 이런 손쉬운 길은 각자의 잠재력을 방해한다. ​3. ’모른다‘라는 말이 입 밖에 나올 때 무슨 일이 벌어지는지 아는가? 뇌가 더 알려고 하지 않는다. ​4. 인간은 본래 알아채고 적응하고 행동하고 반복하는 존재다. 무언가를 알아채도록 타고났는데 답을 찾으려고 애쓰지 않는다면, 삶을 변화시킬 중요한 순간을 스스로 가로막는 일이다. ​5. 따라서 이런 중요한 순간에 마음을 열어두려면, ”모른다“라고 말할 때마다 깨닫고 당장 다른 말로 바꿔야 한다. ​6. 디즈니랜드의 신입 직원은 손님들에게 ”모른다“라고 답하지 않고 대신 ”제가 알아보겠습니다“라고 답한 뒤 실제로 알아보도록 교육받는다. #예술가의해법

< 모른다고 말하는 순간, 뇌도 멈춘다 >

자바 사용자에게 NullPointerException(NPE)은 정말이지 지긋지긋한 예외입니다. 우리 모두는 이로 인한 운영 장애를 수없이 겪으며 디버깅으로 밤을 지새운 경험이 있을 겁니다.

JSpecify로 끝내는 NPE 전쟁

Optional, @Nullable, 다양한 정적 분석 도구.. 그동안 자바의 널 안전성을 지키기 위해 많은 꼼수를 써야 했다. 이제 곧 판이 뒤집힌다. JSpecify가 그 파편화된 규칙을 하나로 통일하고 있기 때문이다.

이 글을 통해 JSpecify가 어떤 배경에서 태어났고, 왜 스프링이 이를 전면 채택했는지, 그리고 실무에서 우리에게 어떤 변화를 가져올지 알아본다.

https://www.linkedin.com/pulse/jspecify%EB%A1%9C-%EB%81%9D%EB%82%B4%EB%8A%94-npe-%EC%A0%84%EC%9F%81-springrunner-kythc?utm_source=share&utm_medium=member_ios&utm_campaign=share_via

Optional, @Nullable, 다양한 정적 분석 도구.. 그동안 자바의 널 안전성을 지키기 위해 많은 꼼수를 써야 했다. 이제 곧 판이 뒤집힌다. JSpecify가 그 파편화된 규칙을 하나로 통일하고 있기 때문이다. 이 글을 통해 JSpecify가 어떤 배경에서 태어났고, 왜 스프링이 이를 전면 채택했는지, 그리고 실무에서 우리에게 어떤 변화를 가져올지 알아본다. https://www.linkedin.com/pulse/jspecify%EB%A1%9C-%EB%81%9D%EB%82%B4%EB%8A%94-npe-%EC%A0%84%EC%9F%81-springrunner-kythc?utm_source=share&amp;utm_medium=member_ios&amp;utm_campaign=share_via

www.linkedin.com

나의 소중한 시간과 에너지를 들여
매일의 순간들을 이 두가지 질문에 집중하며 살아간다.


1. 어떻게 살아가야 할 것인가?
2. 어떻게 더 나은 내가 될 수 있을까?


어떤 곳들에서는 타인을 긁고, 깎아내리고,
타인을 평가하느라 소중한 시간과 에너지를 할애한다.
그럴수록 독이 되어 자기 자신에게 돌아온다.
안타깝다.


남들을 평가하느라 남은 생애를 바치기보다는
남들의 평가를 받기 위해 에너지를 쏟아내기보다는
내 남은 생애를 더 나은 세계로 만들기로 결심을 했다.


그렇게 나는 나를 평가하는 평가자로 살아간다.
나를 평가하고 키우는 평가자가 될 것인가
타인을 평가하고 깎는 평가자가 될 것인가


오늘 마음에 새기는 초인의 이야기

나의 소중한 시간과 에너지를 들여매일의 순간들을 이 두가지 질문에 집중하며 살아간다. 1. 어떻게 살아가야 할 것인가?2. 어떻게 더 나은 내가 될 수 있을까? 어떤 곳들에서는 타인을 긁고, 깎아내리고, 타인을 평가하느라 소중한 시간과 에너지를 할애한다.그럴수록 독이 되어 자기 자신에게 돌아온다.안타깝다. 남들을 평가하느라 남은 생애를 바치기보다는남들의 평가를 받기 위해 에너지를 쏟아내기보다는내 남은 생애를 더 나은 세계로 만들기로 결심을 했다. 그렇게 나는 나를 평가하는 평가자로 살아간다.나를 평가하고 키우는 평가자가 될 것인가타인을 평가하고 깎는 평가자가 될 것인가 오늘 마음에 새기는 초인의 이야기

타인의 평가자가 되어 삶을 허비하지 않기로 하였다

프로그래밍에서 정말 중요한 개념이라고 생각하는 함수에 대해서 에릭이에게 알려주었습니다.

평소에 개발을 하면서는 몰랐는데 함수에 대한 어려운 용어가 참 많더라고요? 선언, 호출, 매개변수, 반환... 이런 말들을 7살 아이가 이해할 리가 만무하죠.

그래서 복잡한 설명은 생략하고, 무작정 그냥 같이 코드를 짜보기로 했습니다. 다행히도 아이가 금방 흥미를 느끼고 따라오더라고요.

그동안 아무렇지 않게 쓰던
print()
나
range()
가 사실 다 파이썬에 내장된 함수라는 걸 알게 되자, 눈이 동그래지고 입을 떡 벌리며 신기해하네요.

특히 마지막에는 뭔가 깨달았다는듯이 스스로 "Everything is a function!"이라고 외치는데, 저도 괜히 전율이 느껴졌습니다. 😆

📱 짧게 보기: https://youtube.com/shorts/_zKml5PB--Q
📺 전체 영상: https://youtu.be/tgBXKj0Tl00

프로그래밍에서 정말 중요한 개념이라고 생각하는 함수에 대해서 에릭이에게 알려주었습니다. 평소에 개발을 하면서는 몰랐는데 함수에 대한 어려운 용어가 참 많더라고요? 선언, 호출, 매개변수, 반환... 이런 말들을 7살 아이가 이해할 리가 만무하죠. 그래서 복잡한 설명은 생략하고, 무작정 그냥 같이 코드를 짜보기로 했습니다. 다행히도 아이가 금방 흥미를 느끼고 따라오더라고요. 그동안 아무렇지 않게 쓰던 <code>print()</code>나 <code>range()</code>가 사실 다 파이썬에 내장된 함수라는 걸 알게 되자, 눈이 동그래지고 입을 떡 벌리며 신기해하네요. 특히 마지막에는 뭔가 깨달았다는듯이 스스로 "Everything is a function!"이라고 외치는데, 저도 괜히 전율이 느껴졌습니다. 😆 📱 짧게 보기: https://youtube.com/shorts/_zKml5PB--Q📺 전체 영상: https://youtu.be/tgBXKj0Tl00

재미있는 함수에 대해 배워볼까요! 😄

일과 사랑, 그리고 인생을 위한 명언 1697개

Books to Read as a Developer

📰  개발자로서 읽어야 할 책 8권

✍️ dev.to에 올라온 개발자 도서 추천글을 번역해보았습니다. 추천된 8권 중 7권이 한글 번역이 되어있으니, 한 권씩 차근 차근 읽어나가보면 좋을것 같아요! 특정 프로그래밍 기술 혹은 언어에 대한 것이 아닌 큰 맥락으로서의 개발 서적들이니 도메인과 분야를 막론하고 한번 도전해보시길 추천합니다. :)  

저는 목록 중에 '코드 컴플리트' 한번 도서관에서 빌려서 앞에 조금 펼쳐보다가 그대로 반납한 기억이 있네요 ^^.. 궁금하시다면! 실물 한번 찾아보시면 바로 끄덕끄덕 하실꺼에요 ㅎㅎ 

--- 

# 실용주의 프로그래머 
- http://www.yes24.com/product/goods/107077663
- 프로그래밍 언어가 아닌 논리 관점에서의 언어 지혜를 다루고 있습니다. 코드 작성, 우수한 팀 구성, 관리, 도구 등 더 나은 프로그래밍을 하기 위한 여러 방법에 대한 이야기를 하고 있습니다. 
- https://pragprog.com/tips/

# 리팩토링 
- http://www.yes24.com/Product/Goods/89649360
- 왜 그리고 언제 리팩토링을 해야할까요? 클래스나 메서드는 어떻게 구성해야 하나요? 유닛 테스트란 뭔가요? 이 책에서 리팩토링에 대한 모든 답을 찾아 볼 수 있습니다. 

# 코드 컴플리트2 
- http://www.yes24.com/product/goods/44130507
- 무려 960 페이지!!! 이 책은 코드 구조, 형식, 변수, 메서드, 팀 관리 등 소프트웨어 개발의 모든 면들을 다 다루고 있어요. 이 엄청난 지식의 양에 감사한 마음이 절로 들지도 모릅니다. 

# 피플웨어 
- http://www.yes24.com/Product/Goods/13657193 
- 프로그래머 관리와 동기부여에 관한 책입니다. 개발 프로세스는 그저 벽돌 쌓기가 아닌 창의적인 과정이니까요! 

# 헤드 퍼스트 디자인 패턴 
- http://www.yes24.com/Product/Goods/108192370 
- 13개의 필수 디자인 패턴를 풍부한 예시와 재밌는 삽화와 함께 설명하는 책입니다. 그저 텍스트만 있는 것이 아니라 손으로 그린 다이어그램과 그림을 통해 개념을 학습하고 몰입할 수 있게 해줍니다. 
- https://longbiao.spatial-crowdsensing.com/courses/scad/files/head-first-design-patterns-compressed.pdf 

# 클린 코드
- http://www.yes24.com/Product/Goods/11681152
- 사람이 읽고 이해하고 유지하기 쉬운 코드를 작성하는 방법에 대한 책입니다. 

# 레거시 코드 활용 전략 
- http://www.yes24.com/Product/Goods/64586851
- 레거시 코드를 가지고 작업하는 건 많은 개발자들이 크게 선호하는 것은 아니지만 피할 수 없는 것이기도 합니다. 이 책은 레거시 코드를 어떻게 올바르게 접근 할 것인지, 그리고 어떻게 안정화 시킬 수 있는지에 대해 이야기 하고 있습니다. 
- https://understandlegacycode.com/blog/key-points-of-working-effectively-with-legacy-code/ 

# A Philosophy of Software Design 
- https://www.amazon.com/Philosophy-Software-Design-John-Ousterhout/dp/1732102201
- 한글 번역본은 없는것 같네요 ㅠ.ㅠ 
- 특정 프로그래밍 언어에 종속 되지 않는 디자인 설계 측면에서 시간을 넘어 통용되는 프로그래밍 원칙에 대한 내용, 그리고 개념 설명을 하고 있습니다.

DEV Community

📰  개발자로서 읽어야 할 책 8권

✍️ dev.to에 올라온 

▶같이 보면 좋은 추천 영상 https://youtu.be/koeM3TRigqU?si=4HiVvueovN4MV2KV ▶'침착맨의 일상재롱' 모아보기 https://www.youtube.com/playlist?list=PLif_jr7pPZAASWh1-PVn4UZHsjzDO99z3 ▶이 영상의 생방송 원본 *2024년 1월 24일 방송분: https://www.youtube.com/live/bAxX0b11tfg?si=rtK2VunGzcZmgDxH #침착맨 

AI에게 침투부의 미래를 묻다

'너 반모 알아?, 반모로 대답해', '대전 왕잉어빵의 서울행 다마스 퀵 배송비용을 계산해줘', '배우 박정민의 2024년 수상 개수를 예.측.해.봐'

답변이나 대응이 제대로 나올까 싶은 질문들을 '챗GPT'(3.5,4.0), 'BARD', '심심이'(?) 와 같은 주요 LLM 모델에 던지는 영상을 보게 되었다.

어이없어 보이는 질문들에 찰떡같이 답변을 내놓기도 하고, 각 서비스의 특성이 잘 드러나는 답변을 보면서 '이색적인' 벤치마크를 만드는 것도 중요하겠다는 생각이 들었다.

실제로 LLM의 벤치마크는 다른 AI 태스크와 달리 특정 지표만으로 나타내기 어렵다. 그래서 언어, 태스크, 수행방식 등에 따라 다양한 지표들이 만들어 지고 있다. 최근에는 전문 지식, 일종의 시험 문제를 해결하던 지표가 아닌 GAIA(a benchmark for General AI Assistants)와 같이 일상처리능력을 평가하는 벤치마크가 나왔다고 한다.
https://www.aitimes.com/news/articleView.html?idxno=155502(GAIA)

해당 연구에서는 사람이 92%, GPT-4가 15%에 불과한 성적을 보였다고 하지만... 인내심은 GPT 가 압도적이지 않을까...?

https://www.youtube.com/watch?v=pE0Ewf2D-ZE

'너 반모 알아?, 반모로 대답해', '대전 왕잉어빵의 서울행 다마스 퀵 배송비용을 계산해줘', '배우 박정민의 2024년 수상 개수를 예.측.해.봐' 답변이나 대응이 제대로 나올까 싶은 질문들을 '챗GPT'(3.5,4.0), 'BARD', '심심이'(?) 와 같은 주요 LLM 모델에 던지는 영상을 보게 되었다. 어이없어 보이는 질문들에 찰떡같이 답변을 내놓기도 하고, 각 서비스의 특성이 잘 드러나는 답변을 보면서 '이색적인' 벤치마크를 만드는 것도 중요하겠다는 생각이 들었다. 실제로 LLM의 벤치마크는 다른 AI 태스크와 달리 특정 지표만으로 나타내기 어렵다. 그래서 언어, 태스크, 수행방식 등에 따라 다양한 지표들이 만들어 지고 있다. 최근에는 전문 지식, 일종의 시험 문제를 해결하던 지표가 아닌 GAIA(a benchmark for General AI Assistants)와 같이 일상처리능력을 평가하는 벤치마크가 나왔다고 한다.https://www.aitimes.com/news/articleView.html?idxno=155502(GAIA) 해당 연구에서는 사람이 92%, GPT-4가 15%에 불과한 성적을 보였다고 하지만... 인내심은 GPT 가 압도적이지 않을까...? https://www.youtube.com/watch?v=pE0Ewf2D-ZE

www.youtube.com

🧐 이색적인 LLM 벤치마크 : 반말모드

영현

(주)무한정보기술 GeoAI팀 소속

 GIS 기반 AI 이미지 처리 기술 연구개발


pyh5214@naver.com 

🧐 이색적인 LLM 벤치마크 : 반말모드

댓글 0

비슷한 게시물

주간 인기 TOP 10

추천 프로필