본문 바로가기

IT 개발자의 창고

LLM (Large Language Model) 이란?

LLM (Large Language Model) 이란?

LLM은 텍스트를 인식하고 생성하는 등의 작업을 수행할 수 있는 일종의 AI 프로그램이다. LLM은 방대한 Dataset을 학습하며, 머신러닝 중 트랜스포머 모델이라고 하는 일종의 신경망을 기반으로 한다.

 

트랜스포머 모델은 문장 속 단어와 같은 순차 데이터 내의 관계를 추적해 맥락과 의미를 학습하는 신경망을 말한다.

 

간단히 말해, LLM은 인간의 언어나 기타 복잡한 데이터를 인식하고 해석할 수 있을 만큼 충분한 예제를 제공받은 컴퓨터 프로그램이다. 많은 LLM은 인터넷에서 수집된 수천 또는 수백만 기가바이트에 달하는 텍스트로 학습된다. 하지만 샘플의 품질이 LLM이 자연어를 얼마나 잘 학습할 수 있는지에 영향을 미치므로, LLM의 프로그래머는 보다 엄선된 데이터 세트를 사용할 수 있어야 한다.

LLM은 문자, 단어, 문장이 함께 작동하는 방식을 이해하기 위해 딥러닝이라는 일종의 머신 러닝을 사용한다. 딥러닝은 비정형 데이터의 확률적 분석을 포함하며, 결국 딥러닝 모델은 사람의 개입 없이도 콘텐츠 간의 구분을 인식할 수 있다.

그런 다음 튜닝을 통해 추가 학습이 이루어진다. 질문을 해석하고 답변을 생성하거나 한 언어에서 다른 언어로 텍스트를 번역하는 등 프로그래머가 원하는 특정 작업에 맞게 미세 조정되거나 프롬프트로 조정됩니다.

 

프롬프트란?
프롬프트는 사용자가 원하는 출력을 생성하고자 할 때 LLM을 안내하기 위해 특정 입력 텍스트 및 질문 텍스트이다. 예를들어 긴 기사를 요약하고 싶다면 LLM에 “Summarize the above in one sentence”와 같은 프롬프트와 기사 텍스트를 입력할 수 있다.
하지만 ChatGPT와 같은 생성 AI를 사용한 경험이 있다면 자신의 프롬프트에 대해 생성 AI가 제대로 답을 하지 못하는 경우를 봤을 것이다. 따라서 우리가 생성 AI의 기반인 LLM의 잠재력을 이끌어내려면 효과적인 프롬프트 작성이 필요하다.

 

프롬프트 예제

 

https://medium.com/daangn/당근에서-llm-활용하기-76131ecebce1

 

당근에서 LLM 활용하기

당근에서는 LLM을 어떻게 활용하고 있는지 소개해요

medium.com