
요즘 AI 하면 보통 텍스트를 읽고 답하는 대형언어모델(LLM)을 먼저 떠올리는데요, 사실 로봇처럼 실제 물리 세계에서 움직이고 일하는 AI는 전혀 다른 이야기예요. 이런 피지컬 AI에게는 '디지털 희토류'라고 부를 만한 엄청 희귀하고 중요한 데이터가 필요해요. 인터넷이나 책 속에 가득한 텍스트 데이터를 먹고 자라지 않고, 실제 로봇이 동작하는 현장, 공장, 주방 등에서 사람이 움직이는 모습을 자세히 기록해야 하거든요.
물리법칙을 텍스트로 적는 건 쉽지만 실제 환경에서 공이 튕기는 정도나 힘을 조절하는 건 복잡해요. 게다가, 사람이 공장에서 어떤 작업을 하든 그 움직임은 그냥 사라지고 기록되지 않아요. 그래서 로봇한테 가르쳐 줄 데이터를 모으려면 사람이 직접 원격으로 로봇 조종하거나, 웨어러블 카메라를 착용해서 작업 과정을 촬영하는 등 정말 특별한 방법이 필요해요.
언어 AI는 느리게 답해도 괜찮지만 로봇 AI는 실시간으로 판단하고 바로 움직여야 해요. 10초 지체하면 상황이 이미 바뀌었거든요. 또 공장마다 쓰는 도구가 다르니 하나의 AI가 다 커버하기도 어렵죠. 실수했다간 값비싼 장비가 고장나거나 사고로 이어질 수 있어 더 까다로운 신뢰성과 안전 기준도 필요해요.
우리나라는 세계 최고 수준의 제조 데이터와 인프라를 갖췄어요. 다만 중요한 건 모으는 것만으로 끝나는 게 아니라 그 가치도 입증해야 한다는 겁니다. 데이터가 리튬처럼 사용되어야 진짜 가치가 빛나니까요.
카본식스 CTO는 제조 AI 분야의 R&D와 데이터 활용이 앞으로 더욱 세밀해져야 한다고 강조합니다. 데이터를 잘 쓰는 기술과 전략이 동반돼야 점점 더 똑똑하고 안전한 피지컬 AI가 탄생할 테니까요.
움직이는 AI가 똑똑해지려면 단순한 텍스트가 아닌 이 세상에서 벌어지는 일들을 생생하게 담아낸 '디지털 희토류' 같은 특별한 데이터가 꼭 필요해요. 그래서 이 데이터 수집 전쟁은 앞으로도 흥미로운 컴뱃 존이 될 것 같네요!