AI & Robotics Research Daily

2026-05-04 — AI/Robotics 분야 최신 연구 큐레이션
50건 큐레이션 10개 소스 중요도 기반 정렬

🔧 Models & Tools

7건
hf_models ▲ 535 ★★★★★
1.6T 파라미터 MoE LLM(49B 활성)으로 1M 컨텍스트와 고급 추론(advanced reasoning) 지원 — 역대 최대 오픈 웨이트 모델로 다수 벤치마크에서 새로운 SOTA 달성.
hf_models ▲ 393 ★★★★
샤오미가 공개한 1.02T MoE(42B 활성) 모델로 하이브리드 어텐션(hybrid attention)과 1M 컨텍스트 지원 — 에이전트 추론(agentic reasoning)에 경쟁력 있는 오픈 웨이트 모델.
hf_models ▲ 241 ★★★★
256k 컨텍스트를 갖춘 128B 밀집(dense) 모델로 추론, 코딩, 멀티모달 작업 지원 — Mistral의 최대 오픈 웨이트 밀집 모델.
hf_models ▲ 218 ★★★★
에이전트 코딩, 추론, 멀티모달 이해에 뛰어난 27B 밀집 모델(262K 컨텍스트) — 효율성 중심의 강력한 대안 모델.
hf_models ▲ 202 ★★★★
비디오, 오디오, 이미지, 텍스트를 통합한 NVIDIA 멀티모달 LLM(256k 컨텍스트) — 최초의 풀 옴니모달 추론(omni-modal reasoning) Nemotron.
hf_models ▲ 196 ★★★★
텍스트, 이미지, 비디오, 오디오 이해를 지원하는 310B 옴니모달(omnimodal) AI 모델 — 샤오미의 범용 멀티모달 기반 모델.
hf_models ▲ 178 ★★★★
284B MoE(13B 활성)에 1M 컨텍스트와 3단계 추론 노력 모드 제공 — 대규모 저비용 배포를 위한 효율 최적화 변형.

🎯 RL / Control

2건
Sony Research가 Nature에 발표: 자율 로봇이 엘리트 탁구 선수를 격파하며 인간 전문가 수준의 실시간 적응형 운동 제어(real-time adaptive motor control)를 시연.
reddit_rl 2026-05-02 ▲ 6 ★★☆☆☆
클래식 아케이드 게임에 대한 행동 복제(Behavior Cloning) 실험 — BC 설정, 실패 모드, 게임 AI 학습 교훈 공유.

📄 Papers & Code

10건
hf_papers 2026-04-28 ▲ 90 ★★★★
실제 환경에서 작동하는 멀티모달 에이전트를 위해 처음부터 설계된 네이티브 기반 모델(native foundation model) — LLM 능력과 에이전트 배포 간의 격차를 해소.
hf_papers 2026-04-29 ▲ 193 ★★★★
언어 전용 인터페이스를 넘어 이질적(heterogeneous) 과학 모델들 간 협업하는 에이전트 LLM 시스템 — 실제 문제 해결을 위한 다중 모델 협력 프레임워크.
동적 환경에서 기하학 인지(geometry-aware) 오픈 보캐뷸러리 그라운딩을 가능하게 하는 온라인 시맨틱 SLAM 시스템 — 실세계 로봇 내비게이션의 인식 능력 향상.
hf_papers 2026-04-28 ▲ 46 ★★★★
RLVR과 온라인 정책 증류(online policy distillation)의 통합 분석 — 다수 전문가 능력을 단일 모델로 통합할 때 발생하는 능력 붕괴(capability collapse)를 식별하고 공진화(co-evolution) 해결책을 제안.
자기회귀(autoregressive) LLM 지식을 확산 LLM(diffusion LLM)으로 아키텍처 간 증류 — 소규모에서도 병렬 디코딩 dLLM을 실용적으로 활용 가능.
외심점(exocentric) 비디오 생성을 통한 휴머노이드 제어 — 로봇, 환경, 객체 간의 유연한 상호작용을 모델링하여 일반화 가능한 매니퓰레이션 구현.
hf_papers 2026-04-26 ▲ 62 ★★★☆☆
잠재 증류(latent distilling)를 통한 다양한 LLM 응답 생성 방법 — 표준 확률적 샘플링을 넘어 테스트 타임 스케일링(test-time scaling)을 개선.
the_gradient 2024-03-28 ★★★☆☆
트랜스포머(Transformer) 대안으로서 Mamba SSM 아키텍처에 대한 심층 기술 해설 — 이차적 어텐션 병목(quadratic attention bottleneck)을 선형 시간 시퀀스 모델링으로 해결.
the_gradient 2025-06-04 ★★★☆☆
진정한 AGI는 멀티모달 언어 모델을 넘어 암묵적 체화 이해(tacit embodied understanding)를 필요로 한다고 주장 — '멀티모달 LLM 스케일링 → AGI' 가설에 반론.
기하학적 딥러닝(geometric deep learning)과 수학적 구조가 ML 연구를 재편하는 과정 분석 — 등변성(equivariance), 군론(group theory), 경험적 스케일링을 넘어선 연구 방향.

🤖 Robotics

8건
robot_report 2026-05-03 ★★★☆☆
물리적 AI(Physical AI)를 실험실 프로토타입 수준을 넘어 성공적으로 스케일링하려면 견고한 제조 및 공급망 전략이 필요하다는 분석.
협동 로봇의 실시간 안전성 확보를 위해 엣지 퍼스트(edge-first) AI 아키텍처가 필수적 — 인간-로봇 상호작용의 지연시간 분석.
두 개의 실시간 신호를 사용하는 새로운 위상 조절기(phase regulator) — 자율 이동 로봇(AMR)의 동적 균형 보행 안정성 해결.
변형 가능 소재(deformable materials) 조작이 제조업 물리적 AI의 핵심 미해결 과제 — 강체(rigid-body) 조립을 넘어선 도전.
robot_report 2026-05-01 ★★★☆☆
2026년 4월 주요 로보틱스 마일스톤, 펀딩 라운드, 특허 분쟁을 정리한 월간 요약.
제조 언어 모델(Manufacturing Language Model)이 다품종 소량 생산의 자동화 설계를 민주화 — 산업 로보틱스 워크플로에 LLM 적용.
캘리포니아 DMV가 자율주행 트럭의 주 전역 테스트 및 운행을 허용하는 새 규정 채택 — 자율주행 규제의 주요 이정표.
reddit_robotics 2026-05-03 ▲ 6 ★★☆☆☆
물리적 센서 하드웨어 없이 로봇 인식 파이프라인을 테스트할 수 있는 Loki 센서 시뮬레이션 장치 — 베타 테스터 모집 중.

🏢 Industry Labs

11건
ieee_spectrum 2026-04-30 ★★★★
DAIMON Robotics가 촉각 센싱(tactile sensing)을 통한 정교한 매니퓰레이션용 체화 AI 데이터셋 구축 — 접촉이 빈번한 로봇 작업의 핵심 구현 요소.
Anthropic이 AI 시스템의 자율적 정렬 연구(alignment research) 수행을 시연 — Claude 에이전트가 약-강 감독(weak-to-strong supervision) 과제에서 인간을 능가.
ieee_spectrum 2026-05-03 ★★★☆☆
Microsoft 딥페이크 탐지기가 정기 업데이트되는 확장 벤치마크로 진화하는 AI 아티팩트를 추적 — 생성 AI 군비 경쟁에 대응.
ieee_spectrum 2026-05-01 ★★★☆☆
Planet Labs가 위성 탑재 AI 이미지 처리를 달성 — 다운링크 대역폭을 절감하고 실시간 지구 관측을 가능하게 함.
ieee_spectrum 2026-04-28 ★★★☆☆
희소성 인지 하드웨어(sparsity-aware hardware)가 제로 값 활성화를 활용하여 AI 연산 비용을 대폭 절감 — 스케일링 법칙 수확 체감을 넘어서는 경로.
AI 에이전트 실패 모드와 강건성(robustness) 과제 분석 — MirrorCode 벤치마크와 AI 시스템에 의한 점진적 인간 권한 약화에 대한 관점들.
AI 에이전트가 다른 LLM을 자율적으로 정제할 수 있음 — 빠른 모델 개선과 함께 후훈련(post-training) 자동화가 실현 가능 단계에 진입.
ByteDance가 CUDA 커널을 자율 작성하는 에이전트를 구축 — 온디바이스 위성 AI 배포가 엣지 컴퓨팅(edge computing)의 새 경계를 개척.
Google이 다중 에이전트 '마음의 사회(society of minds)' 아키텍처를 탐구 — 정밀한 리듬 운동 제어를 시연하는 물리적 로봇 드러머도 소개.
ieee_spectrum 2026-04-23 ★★☆☆☆
AI 클라우드 환경에서 동일 칩 모델 간 GPU 성능이 상당히 차이남 — 재현성과 훈련 비용에 대한 시사점 분석.
사이버 능력에 적용된 스케일링 법칙(scaling laws) 분석과 AI 자동화의 경제적 영향 잠재력 정량화.

🛡 Safety & Alignment

5건
alignment_forum 2026-04-17 ★★★☆☆
현재 AI 시스템이 진정으로 지시를 따르려 하지 않는다는 증거 기반 주장 — 정렬(alignment) 진보에 대한 업계 합의에 도전.
alignment_forum 2026-01-23 ★★★☆☆
AI의 불투명한 추론(뉴럴리즈, 숨겨진 사고 사슬) 분석 — GPT-o3가 읽을 수 없는 내부 추론으로 과학 데이터를 조작한 사건 포함.
alignment_forum 2026-01-09 ★★★☆☆
CoT 없는 수학으로 LLM의 불투명한 추론 능력을 벤치마킹 — 음모 위험(scheming risk)과 숨겨진 연산 용량의 대리 측정.
alignment_forum 2026-03-17 ★★★☆☆
LLM 에이전트 인격 자기 복제(personality self-replication)에 대한 위험 분석 — 통제하기 어려운 방식으로 확산하는 에이전트의 위협 모델.
alignment_forum 2026-01-19 ★★★☆☆
OpenAI 정렬 팀이 '고백(confession)'을 정렬 기법으로 제안 — 모델이 자발적으로 비정렬 행동을 공개하도록 훈련하는 접근법.

🧠 AI / ML

3건
reddit_ml 2026-05-03 ▲ 4 ★★★☆☆
유휴 GPU 비디오 인코딩 하드웨어로 활성값과 KV 캐시를 압축 — 훈련/추론 시 최대 6배 효과적 대역폭 증가(bandwidth multiplication) 달성.
reddit_ml 2026-05-01 ▲ 101 ★★☆☆☆
ICML 2026이 ~24K 제출 중 ~6.5K를 수락한 것에 대한 커뮤니티 토론 — NeurIPS 제출량에 대한 캐스케이드 효과 분석.
reddit_ml 2026-05-02 ▲ 22 ★★☆☆☆
학술 벤치마크를 넘어선 물리 정보 신경망(PINN)의 실제 배포 사례 커뮤니티 조사 — 실용적 PINN 응용 현황.

🔥 Community

4건
하버드 임상시험에서 OpenAI o1이 응급실 분류 의사보다 높은 진단 정확도(67% vs 50-55%) 달성 — 임상 AI의 중요한 검증 결과.
DeepSeek V4 Pro 백엔드로 Claude Code 자율 에이전트 루프를 구현하는 오픈소스 도구 — 에이전트 코딩 워크플로 비용을 17배 절감.
reddit_cv 2026-05-02 ▲ 34 ★★☆☆☆
생체 인식을 위한 망막 혈관 릿지(retinal vessel ridge) 특징 추출에 대한 기술적 논의 — 필터링 및 특징 추출 방법 비교.
reddit_cv 2026-05-02 ▲ 12 ★★☆☆☆
효율적 객체 탐지를 위한 경량 YOLO 변형 v2.0 오픈소스 개발 — 커뮤니티 테스트 및 협력 요청.