2023년 인공지능(AI) 혁신의 주요 사건들
멀티모달 AI의 등장
2023년은 인공지능이 텍스트 뿐만 아니라 이미지, 비디오, 오디오 등 다양한 형태의 데이터를 처리할 수 있는 멀티모달 AI가 대중에게 첫선을 보인 해였습니다. OpenAI의 GPT-4는 이미지와 텍스트 입력을 모두 받아들일 수 있으며, 구글의 DeepMind는 최신 모델 Gemini를 발표하여 이미지와 오디오 작업이 가능함을 시연하였습니다.
헌법적 AI
인공지능을 인간의 가치와 일치시키는 방법은 여전히 큰 질문 중 하나입니다. OpenAI는 "강화 학습과 인간 피드백(RLHF)" 기술을 이용하여 ChatGPT를 조정하였고, 이는 인공지능이 인간의 법칙에 의해 제약되어 인간 번영을 중심으로 작동하도록 합니다. Anthropic 연구소는 2022년 12월 논문에서 '헌법적 AI'를 처음 기술하여 새로운 조정 전략으로 주목받고 있습니다.
텍스트-비디오 변환 도구의 부상
AI에 대한 투자가 급증하면서 텍스트로부터 비디오를 생성하는 도구들이 빠르게 부상하고 있습니다. Runway와 같은 회사는 텍스트 기반 비디오 생성뿐만 아니라 기존 비디오의 스타일을 텍스트 프롬프트로 변경하는 기능을 제공합니다. 또한 Pika AI와 같은 스타트업은 사용자 생성 콘텐츠 분야에서 변화를 시도하고 있습니다.
이러한 혁신들은 인공지능 기술이 어떻게 진화하고 있는지를 보여주며, 인공 일반 지능(AGI)을 향한 여정에서 중요한 단계를 나타냅니다. 더 나아가, 이러한 도구들은 창의적 산업에 영향을 미치며, 인간의 창의성을 증폭시킬 가능성을 제시합니다.