인공지능(AI) 검색 스타트업 라이너는 ‘라이너 검색 LLM’의 일부 성능이 오픈AI의 GPT-4.1을 뛰어넘었다고 3일 밝혔다. 특히 AI 검색 답변 생성에 사용되는 핵심 컴포넌트 평가에서 GPT-4.1 모델보다 우수한 결과를 기록한 것으로 나타났다.
라이너 검색 LLM은 사용자 질문을 분석하고 처리하는 데 필요한 8가지 핵심 컴포넌트를 통합해 자체 개발한 모델이다.
라이너는 동일한 태스크(task·과제)를 기준으로 체계적인 내부 검증 프로세스를 통해 오픈AI의 GPT-4.1과 성능(정확도), 처리 속도, 비용(토큰당 가격)을 비교 분석했다.
그 결과 라이너 검색 LLM은▲카테고리 분류 ▲과제 분류 ▲외부 도구 실행 ▲중간 답변 생성 4개 핵심 컴포넌트에서는 성능·속도·비용 모든 측면에서 GPT 4.1을 능가하는 결과가 나왔다.
또 ▲질문 분해 여부 판단 ▲필요 문서 식별 ▲출처 포함 중간 답변 생성 ▲할 일 관리 4개 컴포넌트에서도 두 가지 이상의 항목에서 경쟁 우위를 기록했다고 밝혔다.
라이너 검색 LLM은 문제를 유연하게 해결하고 정확한 답을 도출하는 데 특화됐다. 토큰당 처리 비용은 GPT-4.1 대비 평균 30~50% 낮다.
조현석 라이너 테크 리드는 “어떤 데이터를 어떻게 학습하고, 어떤 구조로 질문을 처리하느냐가 AI 할루시네이션(환각·hallucination)을 줄이는 핵심”이라며 “앞으로도 리서치에 최적화된 정확한 검색 경험을 제공해 글로벌 시장을 적극적으로 공략해 나가겠다”고 말했다.