오픈AI가 지금까지 공개된 모델 중 가장 강력한 에이전트형 코딩 모델인 GPT-5.3-코덱스를 출시했다고 6일 밝혔다. GPT-5.3-코덱스는 GPT-5.2-코덱스의 프런티어급 코딩 성능과 GPT-5.2의 추론 및 전문 지식 역량을 하나로 결합했으며, 속도는 25% 더 빨라졌다.벤치마크 평가 결과, 이 모델은 SWE-벤치 프로와 터미널 벤치에서 업계 최고 수준의 성능을 기록했고, OS월드와 GDPVal에서도 강력한 성과를 보였다. 이 4가지 벤치마크
구글이 AI의 전략적 사고를 검증하기 위해 포커와 마피아 게임을 공식 테스트 항목에 추가했다고 3일 온라인 매체 기가진이 전했다. AI의 게임 성능을 측정하는 게임 아레나는 2025년부터 구글 딥마인드와 캐글이 협력해 운영하는 벤치마크 플랫폼이다. 기존에는 체스만 포함됐지만, 현실 세계의 불확실성을 반영한 테스트가 필요하다는 판단에 따라 두 가지 게임이 추가됐다.마피아 게임은 자연어 기반 소셜 추론 게임으로, AI가 불완전한 정보 속에서 인간처럼 협상하고 의사소통할 수 있는지를 평가한다.
삼성전자의 최신 모바일 애플리케이션 프로세서 '엑시노스 2600'이 인공지능 벤치마크 테스트에서 퀄컴의 '스냅드래곤 8 엘리트 5세대'와 비교해 일부 항목에서 더 우수한 성능을 보인 것으로 나타났다13일 정보기술 전문 매체 샘모바일에 따르면 IT 팁스터 @BairroGrande가 공개한 '엠엘퍼프 인퍼런스 모바일 v5.0' 결과에서 엑시노스 2600은 총 6개 테스트 가운데 분류·객체 탐지·
인공지능 데이터·신뢰성 평가 전문기업 셀렉트스타가 자체 개발한 AI 안전성 검증 기술로 세계 최고 권위의 학회에서 기술력을 인정받았다.셀렉트스타 AI Safety팀의 연구 논문 ‘문화 맞춤형 레드티밍 벤치마크 생성 프레임워크’가 오는 4월 브라질에서 열리는 ‘ICLR 2026’의 메인 컨퍼런스에 채택됐다.ICLR은 AI 분야에서 가장 영향력 있는 국제 학회 중 하나
NH-Amundi자산운용은 2대 주주이자 유럽 1위 자산운용사인 아문디가 '2026년 책임투자 전망' 리포트를 발표했다고 4일 밝혔다.아문디는 지난해 책임투자 시장이 정상화 흐름을 보였다고 분석했다. 작년 한 해 책임투자 자금 유입은 채권 분야가 주도했으며 특히 유럽 채권 운용자산의 63%를 책임 투자가 차지했다. 유럽 책임투자 주식 전략에서는 단순 배제 중심의 패시브 스크리닝에서 벗어나 벤치마크 대비 추
AI의 최신 모델조차도 웹 검색 기능을 활용해도 약 30% 확률로 사실과 다른 정보를 생성하는 것으로 나타났다.10일 온라인 매체 기가진은 스위스 연방공과대학 로잔과 유럽 AI 연구기관 ELLIS 연구팀의 보고서를 인용해, AI의 사실 오류, 즉 할루시네이션을 정밀하게 측정할 수 있는 새로운 벤치마크 할루하드를 개발했다고 전했다. 할루하드는 단발성 질문이 아닌 현실적인 3턴 대화 형식으로 진행되며, 법률·연구·의학·프로그래밍 등 4개 전문 분야의 950개 문제를 기
알리바바그룹이 최신 추론 모델 ‘큐원3-맥스-씽킹’을 28일 공개했다.해당 모델은 강화학습을 위해 1조 개 이상의 파라미터로 모델 규모를 대폭 확장했으며, 이를 통해 사실적 지식 처리, 복합 추론, 지시 수행, 인간 선호도 정렬, 에이전트 기능 등 여러 핵심 영역에서 성능 향상을 달성했다.알리바바에 따르면 큐원3-맥스-씽킹은 총 19개 주요 벤치마크 평가에서 클로드 오푸스 4.5, 제미나이 3 프로, GPT-5.2-
오픈AI와 암호화폐 투자사 패러다임이 스마트 컨트랙트 사이버 공격 방어를 목표로 손을 잡았다. 두 회사는 AI 에이전트가 스마트 컨트랙트 취약점을 탐지·패치·악용하는 능력을 평가하는 벤치마크 'EVM벤치'를 공개했다고 더블록이 18일 보도했다.오픈AI는 블로그에서 "스마트 컨트랙트는 수십억 달러 자산을 보호하며, AI 에이전트는 공격자와 방어자 모두에게 판도를 바꿀 기술"이라고 밝혔다. AI가 코드를 읽고 쓰고 실행하는 능력이 향상될수록, 경제적으로 의미 있는 환경에서 그 능력
LG CNS가 오픈AI의 기술을 활용해 국내 기업용 AX 시장 공략에 속도를 낸다.최근 LG CNS는 오픈AI와 ‘리셀러 파트너’, ‘엔터프라이즈 AI 서비스 구현 파트너’ 계약을 체결했다. 이번 계약을 통해 LG CNS는 국내 기업 고객에게 기업용 챗GPT 서비스인 ‘챗GPT 엔터프라이즈’의 도입부터 활용, 운영까지 전 과정을 지원한다.챗GPT 엔터프라이즈는 회사의 내부 정보가 외부로 유출되거나 AI 학습에 활용되지 않는 환경을 제공해, 기업이 민감한 업무도 안심하고 처리할 수 있는 것이 가장 큰 장점이
대한민국이 고령 사회로 진입하고 맞벌이 부부와 1인 가구가 급증하면서, 가족을 대신해 병원에 동행해 줄 전문 인력에 대한 필요성이 절실해지고 있다. 이에 따라 환자의 안전한 이동과 진료 과정을 돕는 병원동행매니저가 신중년의 재취업 유망 직종이자 필수적인 사회 서비스 전문가로 각광받고 있다.과거에는 가족이 도맡았던 병원 동행이 이제는 ‘전문 돌봄 영역’으로 변화했다. 특히 대형 병원의 복잡한 키오스크 시스템과 행정 절차는 어르신들에게 큰 진입 장벽이다. 병원동행매니저 자격증은 환자의 픽업부터 접수, 수납, 진료실 동행,
고용률 하락과 일자리 감소 등 고용시장 둔화에 대응해, 김포시는 지역 내 숨은 일자리를 발굴하고 고용 창출을 확대하기 위해 '일자리발굴단'을 운영해 찾아가는 기업 채용상담을 본격 추진한다.오는 3월부터 운영될 일자리발굴단은 김포시일자리센터의 직업상담사를 2인 1조, 총 5개조로 편성해 매월 15개 기업을 방문해 현장 중심의 채용상담을 실시할 계획이다.발굴단은 관내 기업을 직접 찾아가 채용계획 및 인력 수요를 상담하는 한편, 고용환경과 산업 동향을 파악해 구직자와 기업 간 맞춤형 취업 연계를 지원하게
남양주시는 21일 시청 다산홀에서 '2026년 청년취업 대기업·글로벌기업 현직자 직무 멘토링 콘서트'를 개최했다고 밝혔다.이번 행사는 청년이 변화하는 채용 환경을 이해하고 직무 중심 취업 전략을 수립하도록 지원하기 위해 마련됐다. 시는 실제 채용 과정을 반영한 실전형 프로그램을 구성해 현장감을 높였다.현장에는 설 연휴 이후 본격적인 취업 준비에 나선 청년 150여 명이 참여했다. 행사는 ▲취업 특강 ▲공개 모의면접 ▲기업별 소그룹 멘토링 순으로 진행됐다.취업 특강에서는 대기업·글로벌기업 현직자가 최신 채용 동향과 직무 전략을 공유했
부산 기장군이 주택가 밀집 지역의 고질적인 주차난을 해소하고 안전한 보행 환경을 조성하기 위해 '2026년도 내집마당 주차장 갖기 지원 사업'을 본격 시행한다.이번 사업은 기존 주택의 대문이나 담장을 철거 또는 개조해 유휴 부지에 주차 공간을 확보하는 것을 골자로 한다. 사업 대상자로 선정되면 공사 비용의 70% 범위 내에서 가구당 최대 400만 원의 보조금을 지원받을 수 있다.신청 기간은 23일부터 오는 10월 30일까지다. 참여를 희망하는 주택 소유자는 기장군청 교통행정과를 방문하거나 우편