한컴의 야심, 에이전틱 OS로 AI 생태계를 뒤흔들다

🤖 AI가 문서를 읽지 못한다고? 한컴이 그 문제를 해결했다

요즘 ChatGPT나 클로드 같은 AI 도구들이 엄청난 발전을 보여주고 있지만, 여러분은 혹시 이런 경험 해보신 적 없나요? PDF 파일을 AI한테 던져주고 “이거 분석해줘” 했더니 엉뚱한 대답이 나온다거나, 표가 깨져서 나온다거나… 사실 AI가 PDF를 제대로 읽지 못하는 건 꽤 유명한 이슈입니다.

놀랍게도 전 세계에 쌓여 있는 PDF 문서가 약 2조 5,000억 개에 달하고, 매년 새로 생기는 것만 무려 2,900억 개라고 해요. 글로벌 기업 문서의 98%, 정부 양식의 90%가 PDF라는 통계도 있습니다. 그런데 문제는 AI가 이 PDF를 우리 눈처럼 자연스럽게 읽지 못한다는 점입니다. 사람에게는 표나 그림, 단락 구조가 명확하게 보이지만, AI한테는 텍스트가 뒤죽박죽 섞여서 들어오는 거죠.

한컴이 바로 이 문제를 해결하는 기술을 내놨습니다. 그것도 오픈소스로 공짜로 풀어버렸어요. 이게 대체 어떤 전략일까요? 오늘은 한컴이 최근 발표한 ‘에이전틱 OS’ 전략과 그 핵심 기술들에 대해 자세히 알아보겠습니다.

📄 ODL(Open Data Loader), 오픈소스로 공개된 PDF 독해 엔진

한컴이 지난해 9월 ‘오픈데이터로더(ODL)’라는 이름으로 공개한 이 기술은, PDF를 AI가 이해할 수 있는 형태로 변환해주는 데이터 로더(data loader)입니다. 쉽게 말해, PDF 속의 텍스트, 표, 이미지, 단락 구조를 AI가 잘 알아먹을 수 있도록 가공해주는 기술이에요.

이 기술이 그냥 만만한 수준이 아니었습니다. 올해 3월 출시된 ODL 2.0 버전은 글로벌 벤치마크 4개 부문에서 모두 1위를 차지했어요. 종합 점수 90%, 읽기 순서 인식 94%, 표 추출 93%, 헤딩 인식 83%라는 기록을 세웠습니다. 글로벌 경쟁 오픈소스 제품들을 모두 제친 거예요.

출시 두 달 만에 개발자들의 성지 깃허브(GitHub)에서 트렌딩 1위 리포지토리에 오르는 기염도 토했습니다. 현재 주요 대형언어모델(LLM)에 “PDF 데이터 추출 툴 추천해줘”라고 물어보면 ODL을 가장 먼저 추천해줄 정도로 인정받고 있다고 합니다.😮

💰 공짜로 풀어서 돈 버는 ‘오픈코어(Open Core)’ 전략

“아니, 이걸 공짜로 풀면 한컴은 어떻게 돈을 버나요?”라고 궁금해하실 수 있어요. 여기에는 ‘오픈코어(Open Core)’ 라는 비즈니스 전략이 숨어 있습니다.

레드햇(Red Hat), 엘라스틱(Elastic) 같은 글로벌 오픈소스 기업들이 이미 써먹고 있는 방식인데요. 핵심 엔진은 무료로 풀어서 전 세계 개발자 생태계를 먼저 장악하고, 그 위에 얹는 고급 기능을 유료 구독으로 판매하는 구조입니다. 개발자들이 먼저 쓰기 시작하면 기업에서도 자연스럽게 도입하게 되는 거죠.

한컴이 첫 번째로 유료화 타깃으로 잡은 시장은 바로 ‘PDF 접근성(Accessibility)’ 시장입니다. 장애인이 PDF 문서를 비장애인과 동등하게 이용할 수 있도록 변환해주는 서비스인데, 미국과 유럽에서는 이걸 법으로 의무화하고 있어서 시장 자체가 탄탄해요.

한컴은 4월 초 ODL에 관련 자동 태깅 기능을 배포했고, 하반기에는 PDF-UA 변환 기능을 유료 애드온(add-on)으로 출시할 계획입니다. 한컴이 추산하는 이 시장 규모는 보수적으로 175억원, 낙관적으로는 600억원에 달합니다. PDF 접근성 시장만으로도 상당한 매출을 기대할 수 있는 셈이죠.

🏗️ ‘소버린 에이전틱 OS’가 대체 뭔데?

한컴이 궁극적으로 그리고 있는 그림은 ‘소버린 에이전틱 OS(Sovereign Agentic OS)’입니다. 여기서 ‘에이전틱(Agentic)’이라는 단어가 요즘 AI 업계에서 가장 핫한 키워드인데요.

기존의 AI는 우리가 질문을 하면 답을 내놓는 수동적인 도구에 가까웠습니다. “이 데이터 분석해줘”, “이메일 초안 작성해줘” 같은 구체적인 명령이 필요했죠. 하지만 에이전틱 AI는 다릅니다. 목표만 던져주면 스스로 판단하고 계획을 세워서 실행하고 결과물을 가져옵니다. 여러 AI 에이전트가 서로 협업하면서 복잡한 업무를 알아서 처리하는 거예요.

운영체제(OS)는 이 AI 에이전트들을 통제하고 조율하는 플랫폼 역할을 합니다. 그리고 ‘소버린(Sovereign)’이라는 수식어는 데이터가 외부 클라우드로 새지 않도록 보장한다는 의미입니다. 공공기관이나 금융사처럼 데이터 보안이 생명인 조직을 주요 고객으로 상정한 거죠.

한컴이 벤치마크로 삼은 기업이 재미있는데, 바로 미국의 데이터 플랫폼 기업 팔란티어(Palantir)입니다. 팔란티어는 자체 LLM(대형언어모델) 없이도 데이터 통합 플랫폼과 AI 에이전트 플랫폼의 결합만으로 글로벌 공공·국방 시장에서 성공을 거둔 사례입니다.

🔗 LLM 비종속 아키텍처의 의미

한컴 전략에서 가장 눈여겨볼 점은 ‘LLM 비종속(非依存)’ 아키텍처입니다. 요즘 많은 기업들이 자체 AI 모델을 만들겠다고 엄청난 비용을 쏟아붓고 있는데, 한컴은 정반대의 길을 선택했어요.

고객이 원하는 LLM을 자유롭게 선택해서 연결할 수 있도록 한 것입니다. OpenAI의 GPT, 구글의 제미나이, 네이버의 하이퍼클로바, 각국이 개발하는 자체 LLM 등 상황에 맞는 모델을 골라 쓸 수 있는 거죠. 이렇게 하면 특정 AI 모델에 종속되지 않고, 고객의 요구사항에 유연하게 대응할 수 있습니다.

6월에 에이전틱 OS의 베타 버전이 공개될 예정이며, 하반기에는 실제 도입 환경에서 검증을 거쳐 2027년 상반기 정식 출시를 목표로 하고 있습니다. 전사 인력의 30%가 이 프로젝트에 직접 투입될 정도로 한컴의 역량을 총동원하고 있죠.

🌍 AI 패러다임의 변화가 가져올 의미

한컴의 이번 전략 발표는 몇 가지 중요한 시사점을 던져줍니다.

첫째, 오픈소스 기반 AI 생태계의 부상입니다. ODL의 사례가 보여주듯, 핵심 기술을 오픈소스로 공개해 생태계를 선점한 후 부가 서비스로 수익화하는 전략이 AI 분야에서도 통하고 있습니다. 레드햇이 리눅스로 성공한 길을 AI 시대에 재현하려는 시도로 볼 수 있겠네요.

둘째, ‘소버린 AI’의 중요성입니다. 데이터 주권에 대한 각국의 민감도가 높아지면서, 데이터가 외부로 유출되지 않는 자체 AI 인프라에 대한 수요가 폭발적으로 증가하고 있습니다. 특히 공공, 국방, 금융 분야에서 이러한 니즈가 두드러집니다.

셋째, 에이전틱 AI의 진화 속도입니다. 단순한 챗봇을 넘어 스스로 판단하고 실행하는 AI 에이전트가 실제 업무 환경에 적용되는 시점이 생각보다 빠르게 다가오고 있습니다. 한컴이 2027년을 목표로 잡은 것도 결코 먼 미래의 이야기가 아니라는 뜻이겠죠.

✍️ 마치며

솔직히 한글 프로그램만으로 유명한 회사라는 이미지가 강했던 한컴이, AI 분야에서 이렇게 과감한 행보를 보일 줄은 몰랐습니다. PDF 읽기 엔진을 오픈소스로 공개한 것부터 시작해, 에이전틱 OS라는 큰 그림까지. 자체 LLM 개발에 집착하지 않고 생태계와 플랫폼에 집중하는 전략이 실제로 성공할 수 있을지 지켜보는 것도 흥미로울 것 같아요.

앞으로 6월에 공개될 에이전틱 OS 베타 버전, 그리고 하반기 PDF 접근성 애드온 출시 소식까지. 한컴의 AI 변신이 어떤 결말을 맞이할지 계속 주목해볼 필요가 있겠습니다.

여러분은 어떻게 생각하시나요? 한컴의 오픈소스 전략이 성공할까요? 댓글로 의견 남겨주세요! 😊