오픈AI가 지금까지 공개된 모델 중 가장 강력한 에이전트형 코딩 모델인 GPT-5.3-코덱스를 출시했다고 6일 밝혔다. GPT-5.3-코덱스는 GPT-5.2-코덱스의 프런티어급 코딩 성능과 GPT-5.2의 추론 및 전문 지식 역량을 하나로 결합했으며, 속도는 25% 더 빨라졌다.벤치마크 평가 결과, 이 모델은 SWE-벤치 프로와 터미널 벤치에서 업계 최고 수준의 성능을 기록했고, OS월드와 GDPVal에서도 강력한 성과를 보였다. 이 4가지 벤치마크
구글이 AI의 전략적 사고를 검증하기 위해 포커와 마피아 게임을 공식 테스트 항목에 추가했다고 3일 온라인 매체 기가진이 전했다. AI의 게임 성능을 측정하는 게임 아레나는 2025년부터 구글 딥마인드와 캐글이 협력해 운영하는 벤치마크 플랫폼이다. 기존에는 체스만 포함됐지만, 현실 세계의 불확실성을 반영한 테스트가 필요하다는 판단에 따라 두 가지 게임이 추가됐다.마피아 게임은 자연어 기반 소셜 추론 게임으로, AI가 불완전한 정보 속에서 인간처럼 협상하고 의사소통할 수 있는지를 평가한다.
삼성전자의 최신 모바일 애플리케이션 프로세서 '엑시노스 2600'이 인공지능 벤치마크 테스트에서 퀄컴의 '스냅드래곤 8 엘리트 5세대'와 비교해 일부 항목에서 더 우수한 성능을 보인 것으로 나타났다13일 정보기술 전문 매체 샘모바일에 따르면 IT 팁스터 @BairroGrande가 공개한 '엠엘퍼프 인퍼런스 모바일 v5.0' 결과에서 엑시노스 2600은 총 6개 테스트 가운데 분류·객체 탐지·
인공지능 데이터·신뢰성 평가 전문기업 셀렉트스타가 자체 개발한 AI 안전성 검증 기술로 세계 최고 권위의 학회에서 기술력을 인정받았다.셀렉트스타 AI Safety팀의 연구 논문 ‘문화 맞춤형 레드티밍 벤치마크 생성 프레임워크’가 오는 4월 브라질에서 열리는 ‘ICLR 2026’의 메인 컨퍼런스에 채택됐다.ICLR은 AI 분야에서 가장 영향력 있는 국제 학회 중 하나
NH-Amundi자산운용은 2대 주주이자 유럽 1위 자산운용사인 아문디가 '2026년 책임투자 전망' 리포트를 발표했다고 4일 밝혔다.아문디는 지난해 책임투자 시장이 정상화 흐름을 보였다고 분석했다. 작년 한 해 책임투자 자금 유입은 채권 분야가 주도했으며 특히 유럽 채권 운용자산의 63%를 책임 투자가 차지했다. 유럽 책임투자 주식 전략에서는 단순 배제 중심의 패시브 스크리닝에서 벗어나 벤치마크 대비 추
AI의 최신 모델조차도 웹 검색 기능을 활용해도 약 30% 확률로 사실과 다른 정보를 생성하는 것으로 나타났다.10일 온라인 매체 기가진은 스위스 연방공과대학 로잔과 유럽 AI 연구기관 ELLIS 연구팀의 보고서를 인용해, AI의 사실 오류, 즉 할루시네이션을 정밀하게 측정할 수 있는 새로운 벤치마크 할루하드를 개발했다고 전했다. 할루하드는 단발성 질문이 아닌 현실적인 3턴 대화 형식으로 진행되며, 법률·연구·의학·프로그래밍 등 4개 전문 분야의 950개 문제를 기
알리바바그룹이 최신 추론 모델 ‘큐원3-맥스-씽킹’을 28일 공개했다.해당 모델은 강화학습을 위해 1조 개 이상의 파라미터로 모델 규모를 대폭 확장했으며, 이를 통해 사실적 지식 처리, 복합 추론, 지시 수행, 인간 선호도 정렬, 에이전트 기능 등 여러 핵심 영역에서 성능 향상을 달성했다.알리바바에 따르면 큐원3-맥스-씽킹은 총 19개 주요 벤치마크 평가에서 클로드 오푸스 4.5, 제미나이 3 프로, GPT-5.2-
오픈AI와 암호화폐 투자사 패러다임이 스마트 컨트랙트 사이버 공격 방어를 목표로 손을 잡았다. 두 회사는 AI 에이전트가 스마트 컨트랙트 취약점을 탐지·패치·악용하는 능력을 평가하는 벤치마크 'EVM벤치'를 공개했다고 더블록이 18일 보도했다.오픈AI는 블로그에서 "스마트 컨트랙트는 수십억 달러 자산을 보호하며, AI 에이전트는 공격자와 방어자 모두에게 판도를 바꿀 기술"이라고 밝혔다. AI가 코드를 읽고 쓰고 실행하는 능력이 향상될수록, 경제적으로 의미 있는 환경에서 그 능력
한비 김평일 한라야생화회 회장의 ‘제주의 들꽃’ 연재에 힘입어 꽃에 담긴 전설을 전하는 ‘전설을 품고 피어난 꽃들’을 두번째 새로운 기획으로 연재를 시작합니다. 꽃의 전설을 연구해 온 제주자생란연구소 제주오름 조윤하 선생은 제주 출신 교육자이자 생태작가로도 활동하는 야생화 사진작가입니다. 40여 년간 초등교육에 헌신하며 과학과 환경교육에 힘써 왔고, 지난 2012년 한라환경대상을 수상했습니다. 우리 곁에 있는 아름다운 꽃에 대한 전설은 앞으로 100회에 걸쳐 연재할 예정입니다. 84. 꽃처녀의 혼이 맺혀 핀 여름새우난초학
서귀포시는 설 명절 연휴를 맞아 전통시장 7개소 및 대형마트 2개소를 비롯하여 다중이용시설 56개소에 대해 안전점검을 실시했다고 18일 밝혔다.이번 점검은 서귀포시를 비롯, 제주특별자치도 사회재난과, 유관기관 및 민간전문가 등이 참여, 관내 전통시장, 대형마트 및 다중이용시설들을 대상으로 발생할 수 있는 화재 및 각종 안전사고를 예방하고 안전을 확보하기 위해 추진됐다.주요 점검 사항은 ▲소방시설 점검 ▲시장 건축 구조물 상태 ▲전기 설비 노후 상태△가스용기 보관 상태△시설의 전반적 관리상태 등이 포함됐다.점검에 따라 발생한 송수구
충남 서천군은 지난 12일 설 명절을 앞두고 서천임시특화시장 일원에서 ‘설 명절 물가안정 캠페인’을 실시했다. 이번 캠페인은 명절 성수기를 맞아 소비자 물가 상승을 완화하고 군민들의 경제적 부담을 덜기 위해 마련됐으며, 서천군과 지역 소비자단체가 함께하는 민·관 합동 행사로 진행됐다. 이날 행사에는 나예환 소비자교육중앙회 서천군지부장을 비롯한 소비자단체 회원 20여명이 참여해 시장 상인들을 대상으로 명절 성수품의 과도한 가격 인상 자제를 요청했다. 또한 가격표시제 및 원산지 표시 준수를 강조하며 공정한 상거래 질서 확
이재용 삼성전자 회장과 정의선 현대차그룹 회장, 구광모 LG 회장, HD현대 정기선 회장이 23일 방한한 루이스 이나시우 룰라 다시우바 브라질 대통령을 만나 브라질을 필두로 한 중남미 시장 공략을 위한 협력 방안을 논의했다.이재용 회장을 비롯한 총수들은 이날 한국경제인협회 주최로 서울 중구 롯데호텔에서 열린 '한-브라질 비즈니스 포럼'에 참석했다.총수들은 룰라 대통령의 기조연설이 예정된 폐회식에 앞서 행사 장소를 찾아 그와 차담회를 가졌다. 차담회는 행사를 공동 주최한 브라질 수출투자진흥청
인터넷전문은행 케이뱅크가 일반투자자 대상 공모주 청약에서 134.6대 1의 경쟁률을 기록했다고 23일 밝혔다.일반 투자자 배정 물량 1764만 주에 대해 총 23억7412만 주가 신청됐으며, 청약 건수는 83만6599건으로 집계됐다.청약 증거금은 9조8500억 원으로 잠정 집계됐다. 중복 청약을 제외하지 않은 기준이다. 케이뱅크는 오는 25일 납입을 거쳐 다음 달 5일 유가증권시장에 상장한다. 상장 후 예상 시가총액은 3조3673억 원이다.대표 주관사는 NH투자증권, 삼성증권이며 인수단으로 신한투자증권이
커뮤니티 플랫폼 레딧 주가가 2026년 초 40% 이상 폭락했다.디인포메이션 보도에 따르면 미국 내 이용자 성장 정체, 광고 수익 둔화, AI 모델들 레딧 데이터 의존도 하락이 주요 원인으로 꼽힌다. 미국 내 레딧 일일 로그인 이용자 수는 2025년 2300만명 수준에서 제자리를 맴돌았다. 레딧이 신규 광고 파트너를 유치하지 못하고, 기존 광고주 지출도 2026년 들어 줄어들고 있다는 지적도 나오고 있다.챗GPT 등 생성형 AI 모델들도 레딧 데이터 사용을 줄였다. 최고경영자와 최고기술책임자 등 핵심 임원