에이닷 얼리어닷터 1기
[1차]퀘스트 A "멀티 LLM 그것이 궁금하다!"
Donghun Kang
2024. 9. 16. 21:43
안녕하세요! SKT 얼리어닷터 1기 강동훈입니다.
첫번째 퀘스트로 에이닷에서 사용하는 멀티 LLM을 비교/분석해보도록 하겠습니다.
[퀘스트A]
- 멀티 LLM
"멀티 LLM"은 무엇일까요? SKT 에이닷에 있는 SKT 대화형 LLM인 A.X에게 질문해보았습니다.
멀티 LLM이란?
여러 언어를 처리하고 이해할 수 있는 대규모 언어 모델.
LLM(Large Language Model)이란?
매우 방대한 데이터 세트를 바탕으로 학습된 인공지능(AI) 언어 모델입니다. 이 모델들은 사람의 언어를 이해하고 생성하며, 다양한 언어 작업을 수행할 수 있습니다.
- 멀티 LLM의 종류
그렇다면 LLM에는 어떤 것들이 있고 어느 상황에서 사용하는게 좋을까?
다음은 SKT에이닷에 탑재되어 있는 AI의 종류입니다.
에이닷에서는 아래와 같은 대화형 LLM에이전트를 경험해 볼 수 있습니다.
- 모델 별 비교
이제는 에이닷에서 제공하는 여러 대화형 LLM에게 동일한 질문을 해보며 비교/분석을 진행해보도록 하겠습니다.
저는 다음 4가지를 기준으로 정해서 각 모델을 비교해보고자 합니다.
1. 응답의 정확성 및 깊이
정보의 정확성과 깊이를 평가합니다. 응답이 얼마나 사실에 기반하고 논리적인지 확인하고, 복잡한 질문에 대해 얼마나 잘 설명하는지 비교합니다.
2. 언어 표현 및 자연스러움
각 모델의 문장 구성 능력과 답변의 자연스러움을 비교합니다. 문장이 얼마나 매끄럽고 이해하기 쉬운지, 표현이 명확한지 평가할 수 있습니다.
3. 창의성 및 문제 해결 능력
추상적이거나 창의적인 문제에 대해 각 모델이 얼마나 독창적이고 혁신적인 답변을 제공하는지 확인합니다.
4. 응답 속도 및 효율성
질문에 대한 응답 속도와 처리 효율성을 측정합니다. 특히 복잡한 문제를 해결할 때 얼마나 빠르고 효율적으로 답변을 제공하는지를 비교할 수 있습니다.
공통 질문으로는 "AI 발전이 우리 사회에 미치는 영향에 대해 설명해줘."로 통일하고 각 모델들에게 질문해보겠습니다.
- A.X
- 특징
1. 구조적이고 체계적인 응답
5가지 항목으로 나뉘어 명확하게 구분되어 있다.
2. 다양한 사회적 측면 고려
여러 사회적 영역을 포함하여 폭 넓은 시각을 제시하고 있다.
3. 균형 잡힌 시각
긍적적, 부정적 측면을 모두 언급하며 균형 잡힌 시각을 보이고 있다.
4. 미래지향적인 논의
AI 기술 발전에 따른 미래 변화와 문제점을 언급하며 적극적인 사고를 반영하고 있다.
- Perplexity
- 특징
1. 구조적 응답 및 세부내용
AI 발전의 긍정적 영향(생산성 향상, 의료 개선, 일상생활의 편의성 증대 등)과 부정적 영향(일자리 감소, 사회 양극화 심화, 윤리적 문제 등)을 구체적으로 나누어 설명하고 있다. 또한, 미래에 대한 대응 전략(교육과 훈련 변화, 윤리적 기준 설정 등)까지 언급하여 전략적 대응 방안을 제시하는 점이 특징이다.
2. 출처 제공
Perplexity 모델은 출처를 명시하고 있으며, 이는 정보의 신뢰도를 높이는 데 기여합니다. 이를 통해 사용자에게 보다 사실에 기반한 정보를 제공하려는 의도가 명확해보인다.
3. 긍정적 및 부정적 영향의 균형
긍정적인 영향뿐만 아니라 부정적인 영향에 대해서도 깊이 있게 다루고 있다. 특히 사회적 문제에 대한 경각심을 강조하고 있다.
4. 미래 대응 전략의 명시
AI 발전에 따른 불안감과 사회적 수용도에 대한 문제를 제기하며, 교육과 훈련 변화, 윤리적 기준과 규제, 사회적 책임 등을 구체적으로 제시하고 있다.
- GPT(4o)
- 특징
1. 세부적인 긍정적 영향 설명
업무 효율성 증대, 경제 성장, 편의성 증가 등의 영역에서 AI가 어떤 방식으로 기여할 수 있는지를 상세히 설명합니다.
2. 부정적 영향에 대한 포괄적 분석
고용 불안, 프라이버시 문제, 윤리적 문제 등의 다양한 사회적 이슈를 구체적으로 설명하고 있으며, 각 항목에서 발생할 수 있는 실제 문제를 예시로 들어 사용자가 이해하기 쉽게 전달한다.
3. 윤리적 문제와 안보 위협
윤리적 문제에 대해서는 의사결정의 투명성 결여와 데이터 편향성 등을 강조하며, AI가 인간의 삶에 미치는 심각한 부작용을 제시한다.
4. 결론 및 미래 전망
기술적 발전에 대한 긍정적 시각과 동시에, 신중한 관리의 필요성을 제시하는 점에서 균형 잡힌 관점을 제공한다.
- Claude 3Opus
- 특징
1. 긍정적 영향에 대한 심층적 분석
의료 및 교육 분야에서의 AI 역할을 구체적으로 설명한다. 또한 사회 전반에 걸쳐 AI가 실질적인 혜택을 제공하는 방법에 대한 구체적인 예시를 든다.
2. 부정적 영향에 대한 경고
AI 의사결정 과정에서의 편향과 AI 무기화 가능성 같은 보다 윤리적이고 위험한 측면에 대해 구체적으로 경고하고 있다.
3. 향후 과제 제시
단순한 사회적 영향 설명에 그치지 않고, 정책 및 규제, 인력 재교육, 윤리 강화, 협력과 소통과 같은 구체적인 대응 전략을 제시한다.
4. 전반적 결론
전반적인 결론을 제시한다.
- 비교
이제 위의 4가지 모델을 위에서 언급한 기준으로 비교해보겠습니다.
모델 | 응답의 정확성 및 깊이 | 언어 표현 및 자연스러움 | 창의성 및 문제해결 능력 | 응답 속도 및 효율성 | |
1 | A.X | 넓은 범위 요약, 심도 낮음 | 간결하고 명료 | 사실 전달에 초점 | 빠르고 효율적 |
2 | Perplexity | 세부적 분석, 출처 제공 | 체계적이지만 형식적 | 정보 기반, 현실적 대응 | 빠르지만 효율성 다소 낮음 |
3 | GPT | 다양한 주제 포괄, 심도 깊음 | 매끄럽고 유창한 표현 | 다각적 분석 및 독창적 해결 | 빠르고 매끄러움 |
4 | Claude | 의료, 교육, 윤리적 문제 심도 깊음 | 우아하고 차분한 표현 | 윤리적 문제 해결 및 정책적 대응 | 시간 소요되지만 정교 |
- 후기
각 모델 별로 상황에 따른 효율성이 다를 수 있을 것 같습니다. 예시로 든 질문에서는 개인적으론 "Perplexity"가 가장 답변의 질이 좋았다고 생각하고 색다른 시각을 제공했다고 생각합니다.
에이닷을 통해 처음 접해본 LLM 모델들이 있었는데 모델별로 차이점이 있고 강점이 다른것 같아 상황에 맞추어 효율적으로 사용할 수 있겠다는 생각이 들었습니다.