요즘 AI 관련 업무를 하다 보면 AI 용어에서 파생된 신규 단어들을 자주 접하게 된다. 오늘도 '피지컬 AI' 같은 단어를 접하게 되었는데 솔직히 나도 처음 보는 단어였다. ChatGPT 같은 건 이제 익숙하지만, AI 분야는 정말 하루가 다르게 새로운 용어들이 쏟아진다. 정부 정책 발표나 기술 컨퍼런스 자료를 보면 온통 새로운 AI 용어들 천지다.
이러한 새로운 AI 용어들은 단순히 복잡한 기술 개념을 넘어, AI 발전의 방향성과 미래 사회 변화를 암시한다. AI 관련 업무를 하거나, AI 시대에 대한 이해를 높이고 싶은 사람들을 위해, 무엇보다 내가 필요해서 AI와 관련된 최신 용어들을 정리해 보았다.
1. AI 핵심 개념 및 기반 기술 용어 (Fundamentals)
AI의 기초를 이루는 핵심적인 개념 및 기반 기술과 관련된 용어들이다.
1.1 인공지능 (Artificial Intelligence, AI): 인간의 지능을 모방하여 학습, 추론, 인지, 문제 해결 등을 수행하는 컴퓨터 시스템 또는 소프트웨어이다.
1.2 머신러닝 (Machine Learning, ML): 데이터를 통해 학습하여 패턴을 인식하고 예측을 수행하는 AI의 하위 분야이다. 명시적인 프로그래밍 없이 시스템이 스스로 학습하는 방식이다.
1.3 딥러닝 (Deep Learning, DL): 머신러닝의 한 종류로, 인간 뇌의 신경망을 모방한 '심층 신경망(Deep Neural Network)'을 사용하여 데이터를 학습한다. 이미지 인식, 음성 인식 등 고차원적인 패턴 인식에 강점을 가진다.
1.4 신경망 (Neural Network): 뇌의 뉴런 연결 구조를 모방한 계산 모델이다. 입력층, 은닉층(하나 이상), 출력층으로 구성된다.
1.5 데이터셋 (Dataset): AI 모델 학습 및 평가에 사용되는 정제된 데이터의 집합이다. 학습 데이터, 검증 데이터, 테스트 데이터 등으로 나뉜다.
1.6 알고리즘 (Algorithm): 어떤 문제를 해결하기 위한 일련의 절차나 규칙이다. AI에서는 모델 학습 및 예측 과정에 사용된다.
1.7 빅데이터 (Big Data): 기존 데이터 처리 시스템으로는 분석하기 어려운 방대한 양의 데이터를 의미한다. AI 학습의 핵심 자원이며, 3V(Volume, Velocity, Variety)로 특징지어진다.
1.8 컴퓨팅 파워 (Computing Power): AI 모델의 학습 및 실행에 필요한 계산 능력이다. GPU(그래픽 처리 장치) 등 고성능 하드웨어가 요구된다.
1.9 지도 학습 (Supervised Learning): 정답(레이블)이 있는 데이터를 사용하여 AI 모델을 학습시키는 방식이다. 분류(Classification), 회귀(Regression) 등이 대표적인 예이다.
1.10 비지도 학습 (Unsupervised Learning): 정답(레이블)이 없는 데이터를 사용하여 AI 모델이 데이터 내의 숨겨진 패턴이나 구조를 스스로 발견하도록 학습시키는 방식이다. 군집화(Clustering), 차원 축소 등이 있다.
1.11 강화 학습 (Reinforcement Learning, RL): AI가 특정 환경에서 시행착오를 거치며 최적의 행동 전략을 학습하는 머신러닝 방법론이다. 보상을 최대화하는 방향으로 스스로 학습한다. (예: 알파고)
2. 생성형 AI 및 언어 모델 용어 (Generative AI & LLM)
최근 가장 큰 화두인 생성형 AI 및 자연어 처리(NLP) 분야에서 등장하는 핵심 용어들이다.
2.1 생성형 AI (Generative AI): 기존 데이터를 학습하여 새로운 텍스트, 이미지, 오디오, 비디오 등 독창적인 콘텐츠를 생성하는 인공지능이다.
2.2 거대 언어 모델 (Large Language Model, LLM): 방대한 텍스트 데이터를 학습하여 인간처럼 자연어를 이해하고 생성하는 딥러닝 모델이다. GPT-3, GPT-4, Gemini, Claude, Llama 등이 대표적이다.
2.3 프롬프트 (Prompt): 생성형 AI에게 원하는 결과물을 얻기 위해 입력하는 명령어나 질문이다. AI의 성능을 좌우하는 중요한 요소이다.
2.4 프롬프트 엔지니어링 (Prompt Engineering): AI로부터 최적의 결과물을 얻기 위해 프롬프트를 효과적으로 설계하고 개선하는 기술 및 과정이다.
2.5 환각 (Hallucination): AI가 학습 데이터에 없는 내용을 마치 사실인 것처럼 지어내어 잘못된 정보나 논리적으로 맞지 않는 내용을 생성하는 현상이다.
2.6 멀티모달 AI (Multimodal AI): 텍스트, 이미지, 오디오, 비디오 등 두 가지 이상의 다른 유형의 데이터를 동시에 이해하고 생성하는 AI이다. 인간의 복합적인 인지 능력에 가깝다.
2.7 트랜스포머 (Transformer): 자연어 처리 분야에서 혁신을 가져온 딥러닝 모델 아키텍처이다. 긴 텍스트의 맥락을 효율적으로 이해하는 '어텐션 메커니즘'을 사용한다.
2.8 파인튜닝 (Fine-tuning): 사전에 대규모 데이터로 학습된 거대 AI 모델을 특정 목적이나 특정 분야의 데이터셋에 맞게 추가로 학습시키는 과정이다.
2.9 임베딩 (Embedding): 단어나 문장 같은 비정형 데이터를 AI가 이해할 수 있는 고차원 벡터 공간의 숫자로 변환하는 기술이다. 텍스트의 의미적 유사성을 파악하는 데 활용된다.
2.10 자연어 처리 (Natural Language Processing, NLP): 인간의 언어를 컴퓨터가 이해하고 처리하며, 인간처럼 언어를 생성하도록 돕는 AI 분야이다.
2.11 기반 모델 (Foundation Model): 매우 방대한 데이터를 활용하여 사전 학습되고, 다양한 하위 작업(downstream tasks)에 전이 학습(Transfer Learning)될 수 있는 대규모 AI 모델이다.
2.12 생성적 적대 신경망 (Generative Adversarial Network, GAN): 생성자와 판별자라는 두 개의 신경망이 서로 경쟁하며 학습하여 진짜 같은 데이터를 생성하는 딥러닝 모델이다. (예: 가짜 이미지 생성)
2.13 확산 모델 (Diffusion Model): 노이즈를 추가하는 역과정을 학습하여 깨끗한 이미지를 생성하는 모델이다. 최근 이미지 생성 AI에서 뛰어난 성능을 보인다. (예: Midjourney, Stable Diffusion)
2.14 인컨텍스트 러닝 (In-context Learning): LLM이 프롬프트 내에 포함된 소수의 예시만을 보고도 새로운 작업을 수행하는 능력이다. 모델 자체를 업데이트하지 않고도 학습 효과를 낸다.
3. AI 하드웨어 및 인프라 용어 (Hardware & Infrastructure)
AI 모델의 학습 및 실행에 필요한 하드웨어 및 인프라와 관련된 용어들이다.
3.1 AI 반도체 (AI Chip / AI Accelerator): 인공지능 연산에 특화되어 AI 모델 학습 및 추론 속도를 가속화하는 반도체이다. GPU(그래픽 처리 장치), NPU(신경망처리장치), ASIC(주문형 반도체) 등이 대표적이다.
3.2 GPU (Graphics Processing Unit): 원래 그래픽 처리용으로 개발되었으나, 병렬 연산에 최적화되어 딥러닝 학습에 필수적인 하드웨어로 활용된다.
3.3 NPU (Neural Processing Unit): 인공지능의 신경망 연산에 특화된 반도체이다. GPU보다 전력 효율성이 높고 AI 연산에 더욱 최적화되어 있다.
3.4 엣지 AI (Edge AI): 클라우드 서버가 아닌, 스마트폰, IoT 기기 등 최종 사용자 기기(엣지 디바이스) 자체에서 AI 연산을 수행하는 기술이다. 데이터 처리 속도 향상, 보안 강화, 네트워크 부하 감소 등의 장점을 가진다.
3.5 클라우드 AI (Cloud AI): 클라우드 컴퓨팅 환경에서 AI 모델 학습 및 서비스를 제공하는 방식이다. 방대한 컴퓨팅 자원을 유연하게 활용할 수 있다는 장점을 가진다.
3.6 HPC (High Performance Computing): 매우 복잡하고 대규모의 계산 문제를 해결하기 위한 고성능 컴퓨팅 시스템이다. AI 모델 학습 등 막대한 연산량이 필요한 분야에서 활용된다.
3.7 양자 AI (Quantum AI): 양자 컴퓨터의 원리를 활용하여 기존 컴퓨터로는 해결하기 어려운 복잡한 AI 연산을 수행하는 기술이다. 미래 AI 발전의 잠재적 핵심 동력으로 연구된다.
4. AI 응용 분야 및 미래 지향 기술 용어 (Applications & Future Tech)
AI가 실제 산업에 적용되거나 미래를 이끌 것으로 예상되는 기술 분야의 용어들이다.
4.1 피지컬 AI (Physical AI): AI가 물리적인 세계와 상호작용하며 실시간으로 데이터를 수집하고, 분석하며, 직접 행동을 수행하는 AI 시스템이다. 로봇, 자율주행차, 드론 등 실제 공간에서 작동하는 AI를 의미한다. (내가 최근에 접한 용어다.)
4.2 자율주행 (Autonomous Driving): AI가 차량의 운전 환경을 인지하고 판단하여 스스로 주행하는 기술이다. 레벨 0부터 5까지 단계별로 나뉜다.
4.3 로보틱스 (Robotics): 로봇의 설계, 제작, 운용, 제어 등을 다루는 학문 및 기술 분야이다. AI와 결합하여 자율적이고 지능적인 로봇을 개발한다.
4.4 컴퓨터 비전 (Computer Vision): 컴퓨터가 이미지나 동영상을 보고 사람처럼 사물을 인식하고 이해하도록 만드는 AI 분야이다.
4.5 음성 인식 (Voice Recognition): 사람의 음성 언어를 컴퓨터가 인식하여 텍스트로 변환하거나 명령을 수행하는 AI 기술이다.
4.6 추천 시스템 (Recommendation System): 사용자의 과거 행동이나 선호도를 분석하여 개인에게 맞춤화된 상품, 콘텐츠, 서비스 등을 추천하는 AI 시스템이다. (예: 넷플릭스, 유튜브)
4.7 예측 분석 (Predictive Analytics): 과거 데이터를 기반으로 미래의 사건이나 결과를 예측하는 AI 기술이다. 시장 동향 예측, 수요 예측, 이상 감지 등에 활용된다.
4.8 디지털 트윈 (Digital Twin): 현실의 물리적 시스템이나 프로세스를 가상 공간에 똑같이 구현하여 실시간으로 시뮬레이션하고 분석하는 기술이다. AI와 결합하여 예측 및 최적화에 활용된다.
4.9 AI 에이전트 (AI Agent): 특정 목표를 달성하기 위해 자율적으로 환경과 상호작용하고 의사 결정을 내리는 AI 프로그램이다. (예: 사용자 대신 이메일 관리, 일정 조율 등)
4.10 초거대 AI (Hyperscale AI / Large-scale AI): 수천억 개 이상의 매개변수(파라미터)를 가진 매우 거대한 규모의 AI 모델이다. 방대한 데이터와 컴퓨팅 파워로 학습되어 다양한 분야에서 높은 성능을 보인다. (예: GPT-3, 하이퍼클로바)
4.11 경량화 AI (Lightweight AI): AI 모델의 크기와 연산량을 줄여 저사양 기기나 엣지 디바이스에서도 효율적으로 작동하도록 만드는 기술이다.
4.12 전이 학습 (Transfer Learning): 하나의 작업에서 학습한 모델의 지식을 다른 관련 작업에 적용하여 성능을 향상시키는 기법이다. (예: ImageNet으로 학습된 모델을 의료 이미지 분석에 활용)
4.13 활성 학습 (Active Learning): AI 모델이 학습 과정에서 스스로 가장 불확실하거나 유용한 데이터를 선택하여 사람에게 레이블링을 요청하는 학습 전략이다. 학습 효율을 높인다.
4.14 메타 학습 (Meta-learning): AI 모델이 '어떻게 학습하는지'를 학습하는 기술이다. 새로운 작업을 빠르게 배우고 적응하는 능력을 향상시킨다.
4.15 데이터 중심 AI (Data-centric AI): AI 모델 자체의 성능 개선보다는, 모델 학습에 사용되는 데이터의 품질과 관리에 중점을 두는 AI 개발 접근 방식이다.
4.16 모델 드리프트 (Model Drift): 시간이 지남에 따라 AI 모델의 성능이 저하되는 현상이다. 학습 데이터와 실제 환경 데이터 간의 차이(분포 변화)로 인해 발생한다.
4.17 AI 오케스트레이션 (AI Orchestration): 다양한 AI 모델, 데이터, 인프라를 효율적으로 통합하고 관리하여 복잡한 AI 시스템을 원활하게 운영하는 기술이다.
4.18 검색 증강 생성 (Retrieval-Augmented Generation, RAG): 거대 언어 모델(LLM)이 답변을 생성할 때, 외부 지식 베이스에서 관련 정보를 검색(Retrieval)하여 이를 기반으로 답변을 생성(Generation)하는 기술이다. LLM의 환각 현상을 줄이고 최신 정보 반영에 유리하다. (네가 요청한 용어다.)
5. AI 윤리 및 거버넌스 용어 (Ethics & Governance)
AI 기술의 발전과 함께 사회적 책임 및 규범 정립의 중요성이 커지면서 등장하는 용어들이다.
5.1 설명 가능한 AI (Explainable AI, XAI): AI 모델이 어떤 과정을 통해 특정 결과를 도출했는지 사람이 이해할 수 있도록 설명해주는 기술이다. AI의 의사 결정 과정을 투명하게 공개하여 신뢰성을 높이는 것이 목적이다.
5.2 AI 윤리 (AI Ethics): 인공지능 개발 및 활용 과정에서 발생할 수 있는 사회적, 도덕적, 법적 문제들을 다루는 분야이다. 공정성, 투명성, 책임성, 통제 가능성 등이 주요 논의 대상이다.
5.3 AI 거버넌스 (AI Governance): AI의 개발과 사용을 통제하고 관리하기 위한 정책, 규정, 표준 및 조직적 프레임워크를 의미한다. AI 윤리를 실현하고, AI의 안전하고 책임 있는 사용을 보장하기 위한 구체적인 방법론이다.
5.4 AI 편향 (AI Bias): AI 모델이 학습 데이터의 편향성으로 인해 특정 집단이나 결과에 대해 차별적이거나 불공정한 판단을 내리는 현상이다.
5.5 인공 일반 지능 (Artificial General Intelligence, AGI): 인간처럼 다양한 지적 작업을 수행하고, 새로운 상황에 적응하며, 스스로 학습할 수 있는 범용적인 지능을 가진 AI를 의미한다. (아직은 이론적 단계이다.)
5.6 초지능 (Superintelligence): 인간의 모든 지적 능력을 훨씬 뛰어넘는 가상의 지능이다. AGI를 넘어선 궁극적인 AI 발전 단계로 논의된다.
5.7 책임 있는 AI (Responsible AI): AI 개발 및 배포 전 과정에서 윤리적 원칙, 안전성, 투명성, 공정성 등을 고려하고 사회적 책임을 다하는 것을 목표로 하는 접근 방식이다.
AI 분야는 기술 발전 속도가 매우 빠르고, 그에 따라 새로운 용어들이 끊임없이 생성된다. 피지컬 AI, RAG와 같은 용어들을 통해 AI가 이제 단순한 소프트웨어를 넘어 물리적 세계와 직접 상호작용하고, 더욱 정교하게 정보를 처리하는 단계로 진화하고 있음을 유추할 수 있다.
열심히 공부하자. ㅡ,.ㅡ;
댓글
댓글 쓰기