[주제]
생성형 AI 시대를 이해하기 위한 필수 용어 사전 11가지
- 대형 언어 모델(LLM, Large Language Model)
- GPT(Generative Pre-trained Transformer)
- 매개변수(Parameter)
- 프롬프트 엔지니어링(Prompt Engineering)
- 토큰(Token)
- 플러그인(Plugins)
- GPU(Graphics Processing Unit)
- 환각(Hallucinate)
- 일반 인공 지능(Artificial General Intelligence, AGI)
- 멀티 모달(Multi-Modality)
- 인간 피드백 기반 강화 학습(Reinforcement Learning from Human Feedback, RLHF)
[아티클 요약]
생성형 AI가 기술적 진보를 이룸과 동시에 일상생활에 깊숙이 차지할 미래를 대비하여 개발자가 알아둬야 할 필수 용어 11가지
- 대형 언어 모델(LLM, Large Language Model)
- 광범위한 양의 텍스트 데이터를 학습한 모델을 뜻함
- 인간의 언어 능력 향상 과정을 생각하면 이해하기 쉬움예) 대형 언어 모델 : 방대한 양의 언어 데이터를 학습 → 기본적인 지식을 습득 → 더욱 정교하고 자연스러운 대화 능력을 갖추게 됨
- 예) 인간의 언어 능력 항상 과정 : 옹알이 → 다양한 교육 과정, 일상생활 속 대화, 독서 등을 접함 → 이해력, 추론 능력, 대화 수준, 답변의 정확도 향상
- 광범위한 양의 텍스트 데이터를 학습한 모델을 뜻함
- GPT(Generative Pre-trained Transformer)
- 인간처럼 말할 수 있도록 작문 실력을 훈련 받은 모델
- = 작문 실력을 키워 ‘Chat’과 결합하여 이용되고 있음 (ChatGPT)
- 매개변수(Parameter)
- 요리할 때 필요한 재료와 같은 의미를 지님
- 매개변수가 많아질수록 정교한 답을 생성할 수 있음
- 조정하지 못하면 과적합 문제가 발생할 수 있음
- 과적합(Overfitting) : 모델이 훈련 데이터에 지나치게 적응해버려 새로운 데이터나 일반적인 상황에 대해서는 오히려 성능이 떨어지는 현상
- 조정하지 못하면 과적합 문제가 발생할 수 있음
- 주의할 점 : 각 매개변수의 가중치를 적절히 조정해야 함(어떤 변수는 고정된 값을 가지도록 편향 시킴).
- 매개변수가 많아질수록 정교한 답을 생성할 수 있음
- 요리할 때 필요한 재료와 같은 의미를 지님
- 프롬프트 엔지니어링(Prompt Engineering)
- 생성형 AI 서비스를 보다 효과적으로 활용하기 위하여 쓰여지는 기술을 의미목적지만 명시되어 있을 뿐, 추가적인 정보가 없어서 기대에 부합하지 않는 계획을 제안할 확률이 높음구체적인 정보를 포함하고 있기 때문에 AI는 이 정보를 바탕으로 구체적인 여행 계획을 제안할 수 있게 됨. 또한 표 형태로 출력을 요청하여 별도의 정리 없이 바로 출력할 수 있음.
- 예) 효과적인 질문 : “이탈리아 여행을 위한 7일 일정 계획 세워줘. 로마, 피렌체, 베니스를 꼭 방문하고 싶으며, 역사적인 장소와 현지 음식을 경험하고 싶어. 계획표는 표 형태로 작성해줘”
- 예) 효과적이지 못한 질문 : “이탈리아 여행 계획 좀 세워줘”
- 토큰(Token)
- 언어 데이터를 처리하는 기본 단위
- 예) 단어, 문자, 또는 문장의 일부
- 플러그인(Plugins)
- 기존의 소프트웨어나 시스템에 추가적인 기능을 제공하는 독립된 모듈을 의미함
- 플러그인을 사용하면 프로그램의 기능을 확장하고 개인화 할 수 있음
- 예) 익스피디아(숙박 및 여행 관련 정보 제공), 웹 브라우저(ChatGPT가 인터넷을 검색할 수 있게 됨), 코드 인터프리터(파일 업로드 및 다운로드 지원)
- GPU(Graphics Processing Unit)
- 많은 양의 연산을 동시에 처리할 수 있는 그래픽 카드
- 병렬 처리 능력이 있음
- 예) (1+2+3)+(4+5+6)+(7+8+9+10)
- 많은 양의 연산을 동시에 처리할 수 있는 그래픽 카드
- 환각(Hallucinate)
- AI도 실수를 할 수 있음. 이 현상을 ‘환각’, ‘할루시네이션’이라고 일컬음예) 정보의 오류 : “세종대왕님은 맥북을 활용하여 한글을 창제했습니다
- 예) 상황의 오류 : 여행 계획을 짜달라고 요청했을 때, “여행은 참 좋은 것입니다”
- 예) 비현실적인 내용 : “사과 씨를 심으면 배가 자랍니다”
- 일반 인공 지능(Artificial General Intelligence, AGI)
- 현재 널리 사용되는 AI에 해당함
- 특정 작업이나 기능에 최적화된 인공 지능을 의미
- 예) 언어 번역, 이미지 인식, 게임 등
- 현재 널리 사용되는 AI에 해당함
- 멀티 모달(Multi-Modality)
- 다양한 형태의 모달리티(텍스트, 음성, 이미지 등)를 입력 및 출력에 제한 없이 활용하는 방식을 뜻함예) TTS(Text to Speech) : 텍스트를 음성으로 변환해주는 기술
- 예) SST(Speech To Text) : 음성을 텍스트로 변환해주는 기술
- 인간 피드백 기반 강화 학습(Reinforcement Learning from Human Feedback, RLHF)
- AI 모델이 특정 환경에서 시행착오를 통해 최적의 행동 방식을 학습하는 과정을 말함
- 보상(Reward)을 기반으로 교육시킴
- AI는 인간과 직접적으로 상호 작용하는 서비스이기 때문에 정치적 이슈, 윤리적 문제, 문화적 특성에 대해 부도덕한 사고를 학습하였을 시 심각한 사회적 문제와 갈등을 초래할 수 있어서 꼭 필요한 학습 과정임.
[인사이트]
처음 접해보는 산업 분야이기 때문에 용어에 대한 개념 정리가 필요하다고 생각했습니다.
이번 기회를 통해서 인공 지능(AI)에 대해 더 명확한 개념을 알 수 있게 되었고 AI 중에서도 종류가 많다는 것(AGI, ASI)과 이루고 있는 다른 요소(매개변수, 멀티 모달, 토큰)들도 존재한다는 것을 알게 되었습니다.
앞으로 AI와 관련된 산업에서 종사하기 위해선 용어 습득을 기반으로 작업해야 한다는 걸 깨달았습니다.
'내일배움캠프 TIL > SQL 공부' 카테고리의 다른 글
내일배움캠프 퀘스트 5일차_ 3)과 4) (3) | 2024.11.15 |
---|---|
내일배움캠프 퀘스트 4일차_ 2) 이제 좀 벌었으니 flex 한 번 해볼까요?! (1) | 2024.11.14 |
내일배움캠프 퀘스트 3일차_ 1) 돈을 벌기 위해 일을 합시다! (1) | 2024.11.14 |
내일배움캠프 퀘스트 3일차_SQL 기초 명령어 (3) | 2024.11.13 |
내일배움캠프 퀘스트 1일차_스타터 노트 작성 (0) | 2024.11.12 |