은호레터

차트팩

[은호레터]데일리 차트팩 - 옵션시장 이상징후, 무역협상리스크, 소매유입

2025.07.08 | 조회 252 |

from.

은호

은호레터의 프로필 이미지

은호레터

은퇴 호소인의 경제 전문 뉴스레터

은호레터 구독하기

은호레터는 투자 판단에 도움이 되는 정보를 드리고자 노력합니다. 팔로워 1.7만 이상인 경제 스레드 운영 중입니다. [무료] - 매주 화~토요일은 장 마감 후 시황과 주요 뉴스 정리 발송(휴장일 제외) [유료 ] - 무료 회원 혜택 포함 - 평일 오후 5시 종목 분석글 발송 (하루 1~2개) - 주 6회 데일리 차트팩 제공 (일요일 제외) - 토요일 오후 5시에는 주간 매크로 브리핑 - 시장 상황에 따라 추가 콘텐츠 발송 - 제공되는 컨텐츠의 질과 양은 계속해서 업그레이드 될 예정 월 약 70개 정도의 유료/무료 글을 제공해드립니다. 기존 회원의 구독료는 구독 이후 고정되지만, 신규 구독료는 시간이 지남에 따라 인상될 수 있습니다. 감사합니다.

구독 선택하기

무료

월간 멤버십 (월 3,900원)

연간 멤버십 (연 42,120원)

•연 4,680원 할인 (월 3,510원)

이메일

닉네임

[필수] 메일리 이용약관 개인정보처리방침 에 동의합니다.

[필수] 은호레터에서 보내는 광고성 정보 수신에 동의합니다.

이미 구독하셨나요?

📈데일리 차트팩 - 옵션시장 이상징후, 무역협상리스크, 소매유입

구독자님 안녕하세요. 은호입니다.

하루 동안 봤던 차트들 중에 유의미한걸 모아서 제공하고 있습니다.

데이터는 해석하기 나름이고 시간이 지나봐야 어떤 데이터가 그 당시에 제일 적절했는지

확인이 가능하기 때문에 참고용 정도로 보시면 좋을거 같습니다!

(일부는 스레드에도 업로드 된 차트입니다.)

첨부 이미지

🚀 Grok-4, 추론형 벤치마크에서 압도적 성능

Grok-4가 다양한 테스트에서 인상적인 결과를 보여주었음
HLE (추론 능력 평가)에서 Grok-4 TTC는 45.0%로 가장 높은 점수를 기록
AIME '25 (수학적 사고력 중심)에서는 Grok-4 Std가 95.0%로 압도적 1위
GPQA (사실 기반 질의 응답)에서도 Grok-4 TTC와 Std가 각각 88.0%, 87.0%로 최상위권
SWE-bench (소프트웨어 엔지니어링 관련 문제 해결)에서도 Grok-4-code TTC는 75.0%로 최고 점수

📊 해설

HLE (High-Level-Extraction):

Grok-4는 TTC(Time-Test-Compute) 세팅에서 45.0%를 기록하며 ChatGPT o3 (10.7%)나 Claude 4 Opus (21.6%)를 큰 차이로 앞섰음
이는 Grok-4가 고차원적 추론과 의미 추출 능력에서 뛰어남을 보여줌

GPQA (General-Purpose QA):

모든 모델이 높은 성적을 보였지만 Grok-4 Std/TTC가 각각 87.0%와 88.0%로 최상위
ChatGPT o3는 79.6%로 상대적으로 낮았고, Claude 4는 86.4%로 그 뒤를 이었음

AIME '25 (American Invitational Math Exam 스타일 문제):

Grok-4 Std는 95.0%로 최고 기록. TTC 설정에서도 88.9%로 강세 유지
반면 Claude 4는 88.0%, ChatGPT o3는 75.5%로 하락세를 보임
수학적 추론에 특화된 설정에서는 Grok-4가 독보적인 성능을 입증

SWE-bench (Software Engineering Benchmarks):

Grok-4-code TTC가 75.0%로 1위. Std도 72.0%로 근접
Claude 4 Opus (72.5%)도 근소하게 우위를 보였지만, Grok의 전반적인 일관성이 더 돋보임
ChatGPT o3는 59.6%로 코드 문제에서 격차가 큼

📌 용어 설명

TTC (Test-Time Compute): 테스트 시점에서 더 많은 계산 리소스를 활용하여 정밀도를 높인 세팅
Std (Standard): 표준 설정으로 수행한 결과
HLE: 고차원적 개념 이해 및 추론을 요구하는 문제 평가
GPQA: 일반 상식 및 정보 기반 질의응답 평가
AIME: 미국 수학 경시대회 스타일 문제로, 복잡한 논리/수학 추론 능력 요구
SWE-bench: 실제 코드 기반 문제 해결력 평가

Grok-4는 특히 고난도 수학(AIME)과 추론(HLE)에서 두각을 나타냈으며, 추론형 LLM으로서 GPT-4 o3 대비 확실한 차별점을 보여줌

멤버십 구독자만 읽을 수 있어요

가입하려면 아래 버튼을 눌러주세요

이전 뉴스레터

차트팩

멤버십

[은호레터]메타 플랫폼스 투자 체크포인트: AI 초격차 도전과 현실 리스크 전면 분석

은퇴 호소인의 투자 인사이트

[은호레터]메타 플랫폼스 투자 체크포인트: AI 초격차 도전과 현실 리스크 전면 분석의 썸네일 이미지

2025.07.08 | 조회 258

from.

은호

다음 뉴스레터

아침 뉴스 정리

[은호레터]스페이스X 4000억 달러 가치 / 아마존 프라임데이 매출 부진 / 코어위브, 서클 밸류 논란 등 오늘의 경제 뉴스

은퇴 호소인의 경제 뉴스

[은호레터]스페이스X 4000억 달러 가치 / 아마존 프라임데이 매출 부진 / 코어위브, 서클 밸류 논란 등 오늘의 경제 뉴스 의 썸네일 이미지

2025.07.09 | 조회 283

from.

은호

다른 뉴스레터

차트팩

멤버십

[은호레터]데일리 차트팩

은퇴 호소인의 투자 인사이트

[은호레터]데일리 차트팩의 썸네일 이미지

2025.03.26 | 조회 580

from.

은호

차트팩

멤버십

[은호레터]데일리 차트팩

[은호레터]데일리 차트팩의 썸네일 이미지

2025.03.27 | 조회 538

from.

은호

차트팩

멤버십

[은호레터]데일리 차트팩 - 패닉의 그림자, 반등의 단서들

[은호레터]데일리 차트팩 - 패닉의 그림자, 반등의 단서들의 썸네일 이미지

2025.04.05 | 조회 494

from.

은호

차트팩

멤버십

[은호레터]데일리 차트팩

[은호레터]데일리 차트팩의 썸네일 이미지

2025.03.28 | 조회 470

from.

은호

차트팩

멤버십

[은호레터]데일리 차트팩 - 금 유입 가속 vs 기술주 조정

[은호레터]데일리 차트팩 - 금 유입 가속 vs 기술주 조정의 썸네일 이미지

2025.04.03 | 조회 378

from.

은호

차트팩

멤버십

[은호레터]데일리 차트팩 - 금 매수 급증·물류 붕괴·위안화 절하

[은호레터]데일리 차트팩 - 금 매수 급증·물류 붕괴·위안화 절하의 썸네일 이미지

2025.04.14 | 조회 304

from.

은호

© 2026 은호레터

은퇴 호소인의 경제 전문 뉴스레터

뉴스레터 문의eunho.letter@gmail.com

도움말 자주 묻는 질문 오류 및 기능 관련 제보

서비스 이용 문의admin@team.maily.so

메일리 사업자 정보

이용약관 | 개인정보처리방침 | 정기결제 이용약관 | 라이선스