박현식

페어리 인턴

Determine if a word has a zero byte

표준 라이브러리의 GLIBC 구현을 보면

himagic = 0x80808080L;

lomagic = 0x01010101L;

....

if (((longword - lomagic) & ~longword & himagic) != 0)

이와 같은 연산이 눈에 보입니다.

사실 이 연산은 무척 매력적인 연산입니다.

저는 가끔 아주 쓸모 없는 프로그램을 짜곤 합니다. 그 중에 하나가 개인적인 문자열 함수를 만드는 것이기도 했지요. 그런데, 제가 짠 문자열 함수는 GLIBC 의 구현의 속도를 따라갈 수 없었답니다. 사실 문자열 처리 함수가 쉬울 것이라고 접근한 저의 미숙함이 큰 것이겠지요. 현재의 strlen 구현이 있기 까지, 많은 노고가 들어가 있답니다. 현재는 SIMD(Single Instruction Multiple Data)를 이용하여 기존의 문자열 함수보다 더 빨라졌지만, 32비트 머신에서 32비트의 8비트씩 네번 체크하는 것보다 위의 연산을 쓰면 약 8 단위 시간(어셈 명령어의 하나 수행 시간을 1단위 시간이라고 그냥 정합니다.)으로 32비트씩 0을 체크하면 속도가 더 빨라집니다. 단순하게 비교할 것은 아니지만, "4번의 루프가 1번으로 줄어들 수 있다" 정도라고 생각하시면 됩니다. 그렇다면 64비트 머신에서는 64비트 연산으로 "8번의 루프가 1번으로 줄어들 수 있답니다.", SIMD를 이용하면, 지원하는 모드에 따라서 더 줄어들 수 있을 것이랍니다. 위의 코드의 매력적인 부분은 실행 단위 시간이 작은 연산들을 이용하여 연산 수행 시간을 최적화 했다는 것에 있습니다. 어떻게 위 연산을 생각해낼 수 있었을까요? 🤔

가장 쉬워 보이는 것이 사실 가장 어려울 수 있답니다. 쉬워 보이기 때문에, 그 안에 들어간 고민의 깊이를 얕잡아 보는 저의 케이스일지도 모르지만 😒

((x - 0x01010101) & ~x & 0x80808080)

간단한 문자열 함수 속에 또 어떤 고민들이 들어갔는지...... 프로그래밍의 세계는 쉬운 듯 쉽지 않아 보입니다.

https://github.com/lattera/glibc/blob/895ef79e04a953cac1493863bcae29ad85657ee1/string/strlen.c#L80C7-L80C61

glibc/string/strlen.c at 895ef79e04a953cac1493863bcae29ad85657ee1 · lattera/glibc

GitHub

다음 내용이 궁금하다면?

이미 회원이신가요?

2023년 12월 27일 오전 11:02

저장 2 • 조회 220

함께 읽은 게시물

조찬우

Coupang Sr. iOS Engineer

5월 29일

iOS 19가 아니라 이제 iOS 26?

매

No iOS 19: Apple Going Straight to iOS 26

MacRumors

저장 2 • 조회 1,572

김하림

우아한형제들 프론트엔드 개발자

하루 전

Rolldown-Vite 출시

Announcing Rolldown-Vite

void(0)

저장 1 • 조회 419

달레

Apollo GraphQL Software Engineer

2일 전

Longest Common Subsequence 자바스크립트 풀이

코

Longest Common Subsequence | 알고달레

알고달레

댓글 2 • 저장 5 • 조회 1,271

한성규

'지금 써보러 갑니다' '팁스터 뉴스레터' 운영자

3일 전

👋 디자이너도 앱을 만들 수 있을까?

이

디자이너도 앱을 만들 수 있을까?

Brunch Story

저장 3 • 조회 571

𝙍𝙞𝙘𝙝𝙖𝙧𝙙

처음 배워도 재미있고 가치있는 DATA/AI 교육을 만듭니다.

2일 전

YoY와 MoM

우리는 성장이라는 단어를 좋아합니다.
특히 기업의 입장에서는 성장은 관리해야 할 필수 요소 중 하나죠.

저장 1 • 조회 1,433

김의중

프론트엔드 개발자

6일 전

Next.js 프로젝트를 AWS EKS에 배포하며 배운 것들

최

쿠버네티스를 활용한 클라우드 네이티브 데브옵스 | 존 어런들 - 교보문고

product.kyobobook.co.kr

•

저장 22 • 조회 2,038

비슷한 게시물

이인영 Data Analytics Engineer

고치느냐 새로 만드느냐 그것이 문제로다.

이영준 iOS Developer, 게임도우미

primary key에 uuid를 사용하시나요?

변성윤 머신러닝 엔지니어, Engineering Manager

BigQuery 기능 업데이트-changes(테이블의 변경된 행 반환)

이양일 NaverCloud 백엔드 개발자

📊 Rate Limit Algorithm 을 시각화해서 알아보기

이영준 iOS Developer, 게임도우미

개발할 때 어떤 실수를 하셨나요?

이양일 NaverCloud 백엔드 개발자

🧨 개발자를 잠 못 들게 만드는 코드

주간 인기 TOP 10

진용진 Product manager

PM이 이해하면 좋은 지표 개념

장홍석 스페이스오디티 부대표/CPO

< 쿠팡의 창업자를 직접 보며 배운 것: 리더의 크기가 전부다 >

골빈해커 Chief Maker

나는 가끔 조합형 한글의 아름다움에 대해 생각한다. 그 아름다움

달레 Apollo GraphQL Software Engineer

리트코드 102. Binary Tree Level Order Tr

레드버스백맨 리서처 앤 라이터

⟪🚀 유니콘이라 불리던 그들, 이제 진짜 실력을 보여줄 때⟫

석민 커리어 코치

이력서에 쓰는 경험

백선환 AWS/ AIML Specialist

한때 천만원에 거래되었던 Manus, Bedrock 무료 오픈소스

한성규 '지금 써보러 갑니다' '팁스터 뉴스레터' 운영자

👋 LLM 활용에 도움이 되는 가이드 모음

동크루트 AI 엔지니어, SW 엔지니어

AI 시대에 갈피 못잡던 구글의 역습

𝙍𝙞𝙘𝙝𝙖𝙧𝙙 처음 배워도 재미있고 가치있는 DATA/AI 교육을 만듭니다.

훌륭한 데이터 분석가란 어떤 사람인가?

Determine if a word has a zero byte

댓글 0

함께 읽은 게시물

iOS 19가 아니라 이제 iOS 26?

Rolldown-Vite 출시

Longest Common Subsequence 자바스크립트 풀이

👋 디자이너도 앱을 만들 수 있을까?

YoY와 MoM

Next.js 프로젝트를 AWS EKS에 배포하며 배운 것들

비슷한 게시물

주간 인기 TOP 10

추천 프로필