삼성 오리온 듀얼코어 ARM Cortex-A9 칩. ****

 

예전에 나왔던 삼성의 로드맵.
10년 3분기에 Cortex A9 800MHz 듀얼 Orion이 나오고, 11년 1분기에 양산들어간다는데,
발표를 했네요.
Cortex A-9MP2 1GHz (코어당 2.5 DMIPS/MHz)
허밍버드와 같은 45nm 공정.
L1 캐시 32KB 명령어 + 32KB 데이터, L2 캐시 1MB.
1080P 30fps 디코딩
네이티브 트리플 디스플레이 컨트롤러 아키텍쳐 온보드
(두개의 디스플레이로의 출력과 HDMI를 통한 세번째 디스플레이 지원)
HDMI 1.3a
임베디드 GPS
허밍버드에 비해 5배 향상된 그래픽 성능.
허밍버드가, 이론 90 million triangle/s, 실성능 20~28 million triangle/s 인데,
이론 성능 기준 5배는 아니겠죠.
그냥 추측엔 이론 100~140 million triangle/s, 실성능 40 million triangle/s 정도 될 것같네요.
지금 나와있는 gpu의 성능도 고려해야되니까요.
어쨌든 omap, 테그라2, 스냅드래곤 등등 듀얼코어 제품이 내년 중반부턴 대세가 될듯.

http://blogit.blogkorea.net/38094051/http://feedproxy.google.com/~r/gamma0burst/~3/qYsjv0rNnqE/190

 

2010/11/17 22:57 : from 스마트폰/삼성 samsung

삼성 오리온 듀얼코어 ARM Cortex-A9 칩.

제목에 설명이 다 있네요.
개발자용 임베디드 시스템같은데 정확한건 몰라요.

삼성 Orion 스펙.
Cortex-A9 MP2 1GHz (코어당 2.5 DMIPS/MHz)
삼성 45nm 공정.
L1 캐시 32KB 명령어 + 32KB 데이터, L2 캐시 1MB.
1080P 30fps 디코딩
네이티브 트리플 디스플레이 컨트롤러 아키텍쳐 온보드
(두개의 디스플레이로의 출력과 HDMI를 통한 세번째 디스플레이 지원)
HDMI 1.3a
임베디드 GPS
이론 267 million triangle/s, 1600 million pixel/s (fillrate)
(허밍버드는 이론 90 million triangle/s, 실성능 20~28 million triangle/s)
예전 포스팅에서 저 그래픽 성능이 과장된거 아니냐는 추정을 했는데,
Mali 400 쿼드코어 gpu를 쓴다고합니다.;;
저렇게 박아도 소비전력을 감당할 수 있다는 얘기겠죠.
어쩌면 스마트폰보다는 전력에서 여유가 있는 타블렛쪽이 타겟일지도 모르겠습니다.
Cortex-A9가 기대되는게 이전 아키텍처와 다르게 out-of-order(비순차적) 방식을 쓴다는겁니다.
순차적 실행에 비해 성능상에서 확실히 우위에 있기때문에(특히 체감성능에서;;),
그동안 이론성능에 비해 체감성능이 떨어졌던 상황이 많이 나아지리라 봅니다.
순차적 실행과 비순차적 실행의 차이와 성능과 대한 간단한 예시는 다음 링크에서.
http://gigglehd.com/zbxe/4795843#8

 

 

아톰의 체감성능에 대한 고찰 (비교그래프 @)

풀그림눈

http://gigglehd.com/zbxe/4795843

2010.11.13 13:55:08

443

12

흔히 넷북을 쓰는 사람들의 소감평 중 하나는 ‘넷북은 느리다’ 입니다.

그것도 가끔 잘 나가다가 이해와 용서를 구하기 힘들정도로. ㄱ-;

오늘 순차실행 듀얼이슈작동방식을 탐구하다 원하는건 못건졌지만

엔하위키에서 우연히 이런 대목을 봤습니다.

http://mirror.enha.kr/wiki/%EC%9D%B8%ED%85%94%20%EC%95%84%ED%86%B0%20%EC%8B%9C%EB%A6%AC%EC%A6%88

마지막문단을 보면 때때로 특정 어플리케이션에선 펜티엄2 300mhz보다 느린 경우도 발생한다는 부분,

아톰이 일반 CPU에 비해 느린건 사실이지만 이론벤치마크성능에서

완전체 콘로 시리즈와 비교해도 동클럭 평균 절반의 성능을 보입니다.

더 느려질 때도 있지만 왠만해서 절반의 범위를 유지하는 벤치성능.

훨씬 더 구시대의 유물인 펜티엄2은 비순차실행방식이란 장점이 있지만

뒤떨어진 분기예측, 느린외장캐시, SSE 명령셋조차 없는 기본적인 구조로

왠만해서는 좋게봐줘야 동급클럭 아톰정도의 평가를 받고 있습니다.

어째서 아득하게 먼 클럭차이가 있음에도 이론성능과는 별도로

순차실행 프로세서는 이런 체감성능 저평가를 받게되는 것일까요?

머릿속에서 곰곰히 스케치하다가

우연히 떠오른 비교대상이 있다면 그것은 게임입니다.

아래와 같은 그림으로 그 예를 찾아볼 수 있습니다.

게임의 체감성능을 좌우하는 것은 프레임 유지율 입니다.

아무리 높은 평균프레임을 가져도 특정상황에서 무척 느린 최소프레임을 가지면

멈추거나 끊겨보인 것 처럼 느끼게되고 느리다고 평가하게 되지요.

순차실행(InOrder)도 마찬가지입니다. 비순차실행(OutofOrder)와는 다르게

매우 무겁고 느린명령어를 처리하게되면 파이프라인을 따라 뒤따라오던 모든 명령어도 멈추게됩니다.

[A]와 비슷한 예로 64비트 정수나눗셈이 걸린다면 1~2클럭안에 처리할 수 있는 다른 [B,C,D] 같은

덧셈,뺄셈,로드,스토어,분기,시프트의 대부분의 명령어들이 수십, 많게는 수백클럭씩 지연되어집니다.

순차실행CPU가 비순차에 비해 2~3배 빠르다고 해도,

최악으로 꼬이는 경우에 100배 가까이 느려질 수도 있는게 순차실행구조입니다.

과학연산, 그리드컴퓨팅 용도에 보탠다던지 하는 PC끼리 짜고치는 활동이라면 몰라도

사람이 쓰기엔 무척 환경 정신건강에 악영향을 끼치게 만들 수도 있는게 이 순차구조인 셈이지요. ㄱ-

싱글코어니 듀얼코어니의 차원을 넘어 한 쓰레드에 얼마나 순간적으로 발목을 잡느냐를 말합니다.

성능 외에도 단일프로그램의 불규칙한 처리흐름을 고르게 해주는게 비순차의 역할인 것입니다.

결론은 ‘성능을 떠나서 인오더는 아웃오브오더의 상대가 될 수 없다’ 입니다.

아톰과 비아나노를 비교대상으로 삼을 수도 있고, 곧 나올 밥캣을 대상으로 삼을 수도 있습니다.

심지어 휴대폰 임베디드에서 아웃오브오더를 택한 Cortex-A시리즈에게도 굴욕을 당할 소지가 잇습니다.

인텔이 차세대 넷북CPU에는 비순차실행구조를 도입할거라고 하니 그 때까지 지켜봐야겠습니다.

이 게시물을…

목록 쓰기

2010.11.13 14:11:51

Sound

지름 스텐바이

그렇군요.. 많이 배웠습니다🙂

2010.11.13 14:15:53

그러고보니, 순차식이면 프로세서 사용 계획을 프로그램이 아닌 백그라운드 서비스에 맞추는 것이 좋겠군요?

2010.11.13 14:17:38

풀그림눈

코어 i7에 아톰이 같이 들어가 있다던가 하면 가능할겁니다.
혹은 USB에 꼽는 아톰 위젯모니터라던지 나쁘지 않은 좋은방법이군요 /응?

2010.11.13 18:44:51

아, 그 설정 차이를 잘 모르시나 보군요. 프로그램 우선 설정은 프로세스들을 각각 잘게 쪼갠 상태에서 처리 순서를 자주 번갈아가며 진행하는 것이고, 백그라운드 서비스 설정은 각각의 프로세를 큰 토막으로 잘라 처리 순서가 상대적으로 느리게 번갈아 가며 처리하는 걸로 알고 있습니다.

2010.11.13 18:52:56

풀그림눈

콜백함수의 호출빈도로 알고 있었는데, 좀 다른거였가보네요.
아직 x86시장엔 아웃,인오더 이종코어 혼용된 칩이 없잖아요
그래서 농담삼아 i7+아톰 예길 꺼내봤어요 ㅎㅎ

2010.11.13 19:25:39

Take a rest, and make the best.

그냥 프로세스 우선 순위를 프로그램에 놓느냐 백그라운드 서비스에 놓느냐의 차이 아닌가요..??

2010.11.13 14:27:18

fuhaho

온타리오를 기대합니당

2010.11.13 14:28:15

풀그림눈

또다른 흐름을 유추해본다면 밥캣도 그러하지만,
코어당 ALU 2스테이지 파이프라인을 가진 초기불도저에도 약점이 생길 수있는 부분입니다.
따라서 기대했던 불도저1모듈 = 울프데일급 성능은 보기 힘들가능성이 높고
이를 해결하려면 2세대에서 모듈당 ALU 4스테이지를 5개로 늘려
한개를 두 코어가 공유하는 방식을 도입한다던지 유사한 개선을 할 필요가 있습니다.

2010.11.13 14:44:34

L님과부하S

삽을 들고 있는 L님 그리고 1/7로 쪼개진 것도 모자라 얼음에 갇힌 불쌍한 우리 부하S

생각해보면 Cortex A-9이전의 ARM 프로세서가 이론 성능에 비해 체감 성능이 떨어지는 이유도 In-Order의 단점에 따른 거일 수 있겠네요.

2010.11.13 15:44:27

이네스

宵待雨月|세사가 요란합니다…

역시 IOO가 모든 원흉이였군요.

2010.11.13 17:20:16

생굴

훌륭한 방어였다만 도시를 지키게 둘 순 없지!

전 개인적으로 아톰으로 대표되는 넷북/넷탑이라는걸 인텔 및 PC회사들의 거대한 마켓팅 사기라고 간주합니다.
만약 넷북이 현재 스마트폰처럼 전용 모바일 OS에 그에 걸맞는 어플리케이션 환경을 갖추고 또다른 하나의 플랫폼으로 나왔다면 모르지만, 지금처럼 데스크탑 OS에 데스크탑용 어플리케이션을 갖추고 나온건 아무리 봐도 애시당초 제대로 쓰라고 만들어놓은 물건이 아니라는 생각 뿐이네요.
그렇다고 가격대가 원래 아톰급의 CPU가 쓰이리라 예상했던 OLPC나 클래스메이트PC – 소위 100달러 PC급이라면 모를까, 지금 얼추 가격대를 보면 이건 말그대로 사기죠. 그정도 가격이면 충분히 센트리노급 부품으로도 조합 가능하니깐요.
어떤 벤치마크에선 그래도 펜4급은 되지 않냐고 하는데 글쎄요.. 제 느낌으론 딱 2001년경 쓰던 셀466+XP 체감보다 못합니다. 지금 쓰는 ITX 사이즈 넷탑도 도저히 안돼서 팔아야 하는데 이걸 중고로 팔면 사기같아서 차마 내놓질 못하고 있네요…

2010.11.14 01:52:25

Touchless

近墨者黑 黑者無想

특정 어플에서는 펜티엄2 300mhz보다 느릴 수도 있다니.. In Order 방식의 한계가 드러나는군요.

다음글: GTX 580의 색다른 테스트 [10] –함성길

http://blogit.blogkorea.net/38094051/http://feedproxy.google.com/~r/gamma0burst/~3/qYsjv0rNnqE/190

http://blogit.blogkorea.net/38094051/http://feedproxy.google.com/~r/gamma0burst/~3/qYsjv0rNnqE/190

This entry was posted in Uncategorized. Bookmark the permalink.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s