본문 바로가기
AI 이야기

챗GPT야, 너한테 궁금한게 있는데.. - 넌 그 많은 데이터를 어디서 얻었니?

by 이도양 2024. 10. 6.
반응형

나도 챗GPT를 공부하고 있는 사람으로서

챗GPT가 예상 못한 답을 내놓을때면 가끔 진심으로 감탄할 때가 있다. 

그리고 생각한다.

얘는 도대체 어디서 어떻게, 얼마나 많은 양의 데이터를 학습한걸까?

 

궁금하면.. 물어봐야지. ^^

 

 

Q. 챗GPT는 데이터를 어디서 얻고, 어떤 방식으로 학습을 하니?

A.

 

 

 

Q. 학습에 이용한 데이터셋의 텍스트 데이터 양을 수치로 환산할 수 있어? 사람들이 가늠할 수 있는 예로. 

A.

 

 

 

Q. 너희는 텍스트 데이터를 합법적으로 수집하는 거야? 어떤 식으로 수집해?

A.

 

 

 

Q. 아까 텍스트데이터의 다양한 출처를 얘기하면서 '대화기록'을 언급했는데, 혹시 사람들이 SNS에서 하는 대화내용을 말하는 거야?

A.

(음... 이 부분에서 왜인지 발끈하는 AI의 모습이 연상되는데... ^^  사실 확인이 어려운 부분이니 일단 넘어가주겠다.)

 

 

 

Q. 그럼 대규모 데이터셋을 통해 학습한게  2021년 자료까지라는 얘기구나?

A.

 

 

 

Q. 2021년 이후 날짜의 데이터셋도 계속 추가되고 있는거야?

A.

 

 

 

Q. 음.. 데이터가 업데이트 되지 않았다면, 최신 뉴스에 대해 사람들이 질문을 하면 어떻게 대답을 할 수 있어?

A.

 

 

아.. 역시 친절한 챗GPT씨.

오늘의 질문은 이쯤에서 마친다.  

답변 고마워~.