
최근 정부가 추진 중인 ‘독자 AI 파운데이션 모델’ 개발 심사 과정에서 주요 기업들의 독자성 논란이 거세게 일고 있습니다. 업스테이지와 네이버 같은 대형 기업들이 ‘프롬 스크래치’라 주장하지만, 그 의미와 기준에 대한 해석이 서로 엇갈리면서 논쟁이 불거지고 있습니다. 특히 이현종 빅스터 대표는 학습 데이터보다 소스코드 자체의 독자성 여부를 엄격히 따져야 한다고 발표했습니다. 그는 AI 모델 개발의 핵심 요소를 소스코드, 학습 데이터, 학습 과정으로 나누었으며, 그 중요도는 소스코드가 전체 80%를 차지한다고 설명했습니다. 이러한 시각은 기존 모델 구조에 새 데이터만 적용하는 방식으로는 ‘독자 모델’로 인정받기 어렵다는 점을 분명히 합니다.
더불어 오픈소스 코드 활용은 기술적 문제 그 이상으로 라이선스 변경에 따른 법적 리스크를 수반한다고 경고합니다. 만약 오픈소스 제공자가 라이선스를 바꾸거나 회수할 경우, 이를 사용한 당사자는 법적 대응에 난항을 겪게 되고 이는 곧 국가 주도 AI 사업의 독자성 평가 기준 자체를 흔들 수 있습니다. 오픈소스 활용은 개발 효율성을 높이지만 반대로 “독자성”이라는 개념을 무너뜨릴 수 있으며, 사업이 국가적 차원에서 추진된다면 이런 법적 문제도 미리 철저히 대비해야만 합니다.
AI 모델 개발 과정을 요리 과정에 비유해 보면 엔지니어는 셰프, 학습 데이터는 재료, 알고리즘과 아키텍처는 레시피와 같습니다. 여기서 재료가 바뀌었다고 해서 주방과 요리법 자체가 나의 것이 되지는 않습니다. 진정한 독자 모델이라 함은 기본적인 소스코드 구조와 설계가 내재적으로 독창적인 것이어야 하며, 단순히 새 데이터를 넣어 학습했다고 해서 그 모델이 완전한 의미의 독자 AI라고 볼 수는 없습니다.
정부가 요구하는 짧은 개발 기간과 현실적인 기술 환경 속에서, 기업들은 외국 모델과의 차별화를 위해 고심하고 있지만 이 과정에서 독자성 기준이 흐려졌다는 지적도 제기됩니다. LG AI연구원의 경우 비교적 명확한 독자 소스코드를 기반으로 한 ‘하이브리드 어텐션’ 모델 구조를 선보여 긍정적 평가를 받았습니다. 반면 업스테이지와 네이버의 사례는 소스코드 공개와 검증이 이루어지지 않아 추가 점검이 필요하다는 의견이 많습니다.
국가 주도의 AI 개발 프로젝트는 기술 혁신뿐 아니라 국민들의 신뢰를 기반으로 합니다. 따라서 독자성 판단 기준 및 소스코드의 투명한 공개는 필수적인 법적 절차로 자리 잡아야 합니다. 아울러 오픈소스 라이선스의 변경과 법적 불확실성을 고려하면, 단순한 기술 개발을 넘어서 안정적인 법적 기반 구축이 무엇보다 중요합니다. 향후 AI 모델의 독자성 논란이 법적 분쟁으로 비화하지 않도록 정부와 참여 기업 모두 소스코드에 대한 철저한 검증과 명확한 정책 마련에 힘써야 할 것입니다.