Русский

	Русский
	English

Авторизация

Ip-адрес

Восстановление пароля

Регистрация

Статистика

Сколько инструкций процессора использует компилятор?

Месяц назад я попытался сосчитать, сколько разных инструкций поддерживается современными процессорами, и насчитал 945 в Ice Lake. Комментаторы затронули интересный вопрос: какая часть всего этого разнообразия реально используется компиляторами? Например, некто Pepijn de Vos в 2016 подсчитал, сколько разных инструкций задействовано в бинарниках у него в /usr/bin, и насчитал 411 т.е. примерно треть всех инструкций x86_64, существовавших на тот момент, не использовались ни в одной из стандартных программ в его ОС. Другая любопытная его находка что код для x86_64 на треть состоит из инструкций mov. (В общем-то известно, что одних инструкций mov достаточно, чтобы написать любую программу.)

Я решил развить исследование de Vos, взяв в качестве эталонного кода компилятор LLVM/Clang. У него сразу несколько преимуществ перед содержимым /usr/bin неназванной версии неназванной ОС:

С ним удобно работать: это один огромный бинарник, по размеру сопоставимый со всем содержимым /usr/bin среднестатистического линукса;
Он позволяет сравнить разные ISA: на releases.llvm.org/download.html доступны официальные бинарники для x86, ARM, SPARC, MIPS и PowerPC;
Он позволяет отследить исторические тренды: официальные бинарники доступны для всех релизов начиная с 2003;
Наконец, в исследовании компиляторов логично использовать компилятор и в качестве подопытного объекта :-)

Начну со статистики по мартовскому релизу LLVM 10.0:

ISA	Размер бинарника	Общее число инструкций	Число разных инструкций
AArch64	97 МБ	13,814,975	195
ARMv7A	101 МБ	15,621,010	308
i386	106 МБ	20,138,657	122
PowerPC64LE	108 МБ	17,208,502	288
SPARCv9	129 МБ	19,993,362	122
x86_64	107 МБ	15,281,299	203

В прошлом топике комментаторы упомянули, что самый компактный код у них получается для SPARC. Здесь же видим, что бинарник для AArch64 оказывается на треть меньше что по размеру, что по общему числу инструкций.

А вот распределение по числу инструкций:

Неожиданно, что код для SPARC на 11% состоит из nop-ов, заполняющих branch delay slots. Для i386 среди самых частых инструкций видим и int3, заполняющую промежутки между функциями, и nop, используемую для выравнивания циклов на строки кэша. Наблюдение de Vos о том, что код на треть состоит из mov, подтверждается на обоих вариантах x86; но даже и на load-store-архитектурах mov оказывается если не самой частой инструкцией, то второй после load.

А как набор используемых инструкций менялся со временем?

Единственная ISA, для которой в каждом релизе есть официальный бинарник это i386:

Серая линия, отложенная на правой оси это число разных инструкций, использованных в компиляторе. Как мы видим, некоторое время назад компилятор компилировался гораздо разнообразнее. int3 стала использоваться для заполнения промежутков только с 2018; до этого использовались такие же nop, как и для выравнивания внутри функций. Здесь же видно, что выравнивание внутри функций стало использоваться с 2013; до этого nop-ов было гораздо меньше. Ещё интересно, что до 2016 mov-ы составляли почти половину компилятора.

Самые первые версии LLVM, до появления clang, выпускались ещё и с бинарниками для SPARC. Потом поддержка SPARC утратила актуальность, и вновь она появилась лишь через 14 лет с на порядок увеличившимся числом nop-ов:

Исторически следующая ISA, для которой выпускались бинарники LLVM это PowerPC: сначала для Mac OS X и затем, после десятилетнего перерыва, для RHEL. Как видно из графика, переход после этого перерыва к 64-битному варианту ISA сопровождался заменой большинства lwz на ld, и вдобавок удвоением разнообразия инструкций:

В бинарниках для x86_64 и ARM частота использования разных инструкций почти не изменялась:

При подсчёте инструкций ARM я отсекал суффиксы условий вместе с ними получалось около тысячи разных инструкций, но даже и без них ARM сильно опережает другие ISA по разнообразию генерируемых инструкций. Таким образом, слой b на этом графике включает и все условные переходы тоже. Для остальных ISA, где условными могут быть только переходы и немногие другие инструкции, суффиксы условий при подсчёте не отсекались.

Наконец, самая недавняя ISA, для которой публикуются официальные бинарники это AArch64. Здесь интересно то, что orr с прошлого года почти перестала использоваться:

PowerPC и AArch64 оказались единственными ISA, для которых число разных используемых инструкций всё растёт и растёт.

Источник: habr.com

К списку статей

admin

Опубликовано: 16.06.2020 20:21:53

Сейчас читают

Комментариев (0)

Имя

Электронная почта

Assembler

Разместить FORTH в 512 байтах

Связь СЛОВ через словарик
Оригинал текста Июнь 10, 2021 - 38 минут чтения

Программное
Процессор, эмулирующий сам себя может быть быстрее самого себя

Современный мир ПО содержит настолько много слоёв, что оптимизации могут быть в самых неожиданных местах. Знакомьтесь - год 2000, проект HP Dynamo. Это эмулятор процессора PA-8000, работающий на этом же процессоре PA-8000, но с технологией JIT. И реальные программы, запускающиеся в эмуляторе - в итоге работают быстрее, чем на голом процессоре.

td;dr - всё сказано в заголовке

Программистам из HP Labs стало интересно, а
Duffs device или loop unrolling в Си своими руками
Выглядит ли следующий код валидным С++ кодом? Если да, то какое значение будет выведено в результате его работы?
```
#include <iostream>int main() {  int number = 11;       int count  = number / 4;  int i = 0;    switch (number % 4) {    case 0:       do {      ++i;    case 3: ++i;    case 2: ++i;    case 1: ++i;      } while (count-- > 0);  }  std::cout << i;}
```
С первого взгл
Туториал по FASM (Windows x32 APIWin32API), Hello world!
Коротко о FASM, ассемблере, WinAPI
- Что такое FASM? - Это компилятор ассемблера (flat assembler).
- Что такое ассемблер? - это машинные инструкции, то есть команды что делать процессору.
- Что такое Windows API/WinAPI? - Это функции Windows, без них нельзя работать с Windows.
  
  Что дают WinAPI функции? - Очень много чего:
- Работа с файлами.
- Ра
Перевод Сравнение векторных расширений ARM и RISC-V

Сравнение векторного расширения RISC-V (RVV) и масштабируемого векторного расширения ARM (SVE/SVE2).

Микропроцессоры с векторными командами ожидает большое будущее. Почему? Беспилотные автомобили, распознавание речи, распознавание образов, всё это основано на машинном обучении, а машинное обу
Перевод Перепрограммирование GameBoy за счёт бага в Pokemon Yellow

Pokemon Yellow - это карманная вселенная со своими правилами. В ней можно покупать и продавать предметы, тренировать покемонов, побеждать других тренеров но нельзя менять правила самой игры. Нельзя построить себе дом, поменять музыку или даже переодеться. Точнее, так было задумано. На самом деле есть последовательность валидных команд (типа перемещения из одного места в другое и манипуляций с предметами), которая позволяет преврати

Визуализация данных

Геопространственное моделирование с применением методов машинного обучения

Всем привет! Меня зовут Константин Измайлов, я руководитель направления Data Science в Delivery Club. Мы работаем над многочисленными интересными и сложными задачами: от формирования классических аналитических отчетов до построения рекомендательных моделей в ленте приложения.

Сегодня я расскажу пр
Автозаказ как сделать так, чтобы нужные продукты сами попадали на полки 17000 магазинов по всей стране

В школе все мы решали задачки вида едет из пункта А в пункт Б. Речь преимущественно шла о скорости и времени как быстро доберётся транспортное средство? Реальность, однако, подбрасывает задачки значительно интереснее: Существует масштабная ритейл-сеть по продаже товаров, которой необходимо, чтобы огромное количество номенклатурных позиций доезжало в каждый из 17000 магазинов, расположенных на половине площади самой большой страны в
Как я пытался придумать новый подход к изучению алгоритмов через интерактивные визуализации

Представьте человека, который изучает алгоритмы. Чтобы понять как они работают, приходится изучать их код и представлять, как компьютер будет его выполнять. Это странно почему мы должны учиться думать как компьютер, вместо того, чтобы заставить его помогать на
Анализируем слона вместе с коллегами

Если ваша жизнь DBA, сопровождающего PostgreSQL, наполнена вопросами "а почему так медленно?" и "как сделать, чтобы запрос не тормозил?", наш сервис анализа и визуализации планов запросовexplain.tensor.ru сделает ее немного легче за счет привлечения коллег и обновленных подсказок.
Перевод Как культура жителей города влияет на дизайн карт метро Нью-Йорк

Что бы вы порекомендовали тому, кто впервые приезжает в Нью-Йорк? Посетить Центральный парк? Посмотреть шоу на Бродвее? Увидеть Статую Свободы?

Я бы первым делом посоветовала скачать офлайн-карту метро. Мне предложили это сделать, когда я впервые оказалась в Нью-Йорке, и это спасало меня множество раз.

Когда я переехала в Нью-Йорк, то почти сразу познакомилась с самой знаковой достопримечательностью г
Перевод 5 разных библиотек Python, которые сэкономят ваше время

В этой подборке, переводом которой мы решили поделиться к старту курса о машинном и глубоком об

Компиляторы

Разработка стековой виртуальной машины и компилятора под неё (часть III)

По ходу разработки генератора кода для виртуальной машины понял, что виртуальная машина не готова к полноценным вызовам функций, с передачей аргументов и хранением локальных переменных функций. Поэтому её необходимо доработать. А именно, нужно определиться с
Перевод Rust 1.53.0 IntoIterator для массивов, quotquot в шаблонах, Unicode-идентификаторы, поддержка имени HEAD-ветки в Cargo
Команда Rust рада сообщить о выпуске новой версии 1.53.0. Rust это язык программирования, позволяющий каждому создавать надёжное и эффективное программное обеспечение.

Если вы установили предыдущую версию Rust средствами rustup, то для обновления до версии 1.53.0 вам достаточно выполнить следующую команду:
```
rustup update stable
```
Есл
Перевод Компилятор всё оптимизирует? Ну уж нет

Многие программисты считают, что компиляторы это волшебные чёрные ящики, на вход в которые можно подать хаотичный код, а на выходе получить красивый оптимизированный двоичный файл. Доморощенные философы часто начинают рассуждать о том, какие фишки языка или флаги компилятора следует использовать, чтобы раскрыть всю мощь магии компилятора. Если вы когда-нибудь видели кодовую базу GCC, то и в самом деле могли поверить, ч
История портирования Reindexerа как покорить Эльбрус за 11 дней

Всем привет! На связи Антон Баширов, разработчик из ИТ-кластера Ростелекома. Импортозамещение набирает обороты, а российский софт всё глубже проникает в нашу повседневную ИТ-шную сущность бытия. Процессоры Эльбрус и Байкал становятся более востребованными, комьюнити расширяется, но мысли о необходимости портировать весь наш любимый технологический стек на неизведанную архитектуру E2K звучат страшнее рассказов про горящий в пламени
Recovery mode Сборка ядра Linux 5.12.10 c LLVM 12 Clang и LTO оптимизацией

Технический прогресс не стоит на месте, появляются новые компьютерные архитектуры, компиляторы становятся умнее и генерируют более быстрый машинный код. Современные задачи требуют все более креативного и эффективного решения. В данной статье пойдет речь, на мой взгляд, про
Перевод Sparkplug неоптимизирующий компилятор JavaScript в подробностях

Создать компилятор JS с высокой производительностью означает сделать больше, чем разработать сильно оптимизированный компилятор, например TurboFan, особенно это касается коротких сессий, к примеру, загрузки сайта или инструментов командной строки, когда большая часть работы в

Процессоры

Dreamstation собираем ретрокомпьютер мечты на платформе Socket 8

Давайте снова поговорим о мечтах. Но если в прошлый раз речь шла о детских мечтах, то в этот раз поговорим о мечтах дней текущих. Может быть не столь заветных, но душу греющих. Любой увлеченный чем-либо человек всегда мечтает добиться успеха в своих начинаниях будь то высо
На пути к вершине Магма и Кузнечик на Эльбрусе

В последнее время всё чаще появляются статьи о производительности российских процессоров Эльбрус на различных задачах. Тема криптографии пока что остаётся за кадром, хотя в разное время были упоминания то о высоких возможностях Эльбруса (некий ГОСТ лучше в 9 раз на Эльбрус-4С, чем на Intel Core i7-2600), то о плохой
Cubique reloaded. Обзор сервера HP NetServer LH Pro

Совсем недавно мы с вами познакомились с экспонатом, олицетворяющим суровость и непоколебимость, надежность и долговечность сервером HP NetServer LM, в недрах кубического корпуса которого вот уже больше 28 лет трудится процессор Intel 486DX2 с частотой 66 МГц. Кубич
Внедрение DDR5 будет молниеносным к 2026 году новая память займет 90 рынка

Согласно последнему отчету Yole Developments, внедрение новой памяти DDR5 будет происходить, по меркам сегмента, практически молниеносно. Аналитики компании считают, что уже к 2023 году сумма поставки модулей памяти нового поколения превысят $200 млрд, а к 2026 году новая память займет 90% мирового компьютерного
История портирования Reindexerа как покорить Эльбрус за 11 дней

Всем привет! На связи Антон Баширов, разработчик из ИТ-кластера Ростелекома. Импортозамещение набирает обороты, а российский софт всё глубже проникает в нашу повседневную ИТ-шную сущность бытия. Процессоры Эльбрус и Байкал становятся более востребованными, комьюнити расширяется, но мысли о необходимости портировать весь наш любимый технологический стек на неизведанную архитектуру E2K звучат страшнее рассказов про горящий в пламени
Серия Intel Core 11000B 10 нм для компактных ПК

Несколько неожиданно для всех и даже, похоже, для себя, поскольку на сайте ARK до сих пор имеет место определенная путаница Intel обнародовала информацию о серии

Статистика в it

Перевод Plt0.05, и откуда оно (иногда) берётся

Зарабатывать продажей лекарств, которые заведомо не работают, не только аморально, но и не особо легко. Люди всё-таки обычно не хотят покупать препараты, неэффективность которых была доказана. А вот если вы сумели выдавить заветное p < 0.05 в пользу того, что акупунктура та
Видеокарты продолжат дорожать накрутка при помощи посредников, нехватка мощностей и геймеры

О том, что чипы и железо продолжает дорожать, на Хабре писали не раз и не два. И действительно, дорожают чипы памяти, видеочипы и даже жесткие диски с SSD. Сначала причиной были майнеры, сейчас они продолжают поддерживать стабильный
AB-тест в инженерно-геологических изысканиях на языке Python

1. Введение

При выполнении инженерно-геологических изысканий может возникнуть задача, связанная с сопоставлением данных полевых и лабораторных исследований на одних и тех же грунтах, с целью подтверждения корректной транспортировки проб от объекта изысканий до лаборатории (образцы не были деформированы и/или разрушены в ходе перевозки).

При данной постановке задачи можно применить методику A/B-тестирования со следую
Перевод В офисе полный рабочий день? Нет, спасибо, говорят 86 процентов IT специалистов

Карантинные ограничения продолжают сниматься, и компании готовятся к отмене удаленной работы. Однако сотрудники не торопятся возвращаться.

Профессионалы в области технологий не исключение. По данным опроса Hackajob, эксклюзивно поделившейся его результатами с City A.
Банкам стоит передавать данные клиентов внешним компаниям (но не с целью их продажи, и не всем)

Проблемы, страхи и надежды традиционных банков попробовал резюмировать Google. В своём п
Банки потеряют своих клиентов. Банки не потеряют своих клиентов

Проблемы, страхи и надежды традиционных банков отлично резюмировал Google. В своём тактичном

Aarch64

Сколько инструкций процессора использует компилятор?

Месяц назад я попытался сосчитать, сколько разных инструкций поддерживается современными процессорами, и насчитал 945 в Ice Lake. Комментаторы затронули интересный вопрос: какая часть всего этого разнообразия реально используется компиляторами? Например, некто Pepij

Armv7

Перевод Хостинг блога на GPSLTE-модеме
GPS/WWAN/LTE-модем телефона PinePhone

В процессе разработки ПО на PinePhone я наткнулся на любопытное сообщение в dmesg:
```
[   25.476857] modem-power serial1-0: ADB KEY is '41618099' (you can use it to
```
Установка docker-контейнеров c Zabbix на Raspberry Pi

Добрый день, коллеги!

Сегодня я хочу поделиться с Вами опытом установки приложений в контейнерах Docker на Raspberry Pi.

Появилась необходимость установить Zabbix для тестирования и экспериментов. Zabbix должен быть всегда включен, поэтому установка на ноутбук или стационарный компьютер не подходит. В моем распоряжении был микрокомпьютер Raspberry Pi. Он хорошо подходит для небольших проектов. Маленький и бесшумный -
Сколько инструкций процессора использует компилятор?

Месяц назад я попытался сосчитать, сколько разных инструкций поддерживается современными процессорами, и насчитал 945 в Ice Lake. Комментаторы затронули интересный вопрос: какая часть всего этого разнообразия реально используется компиляторами? Например, некто Pepijn

I386

Вехи истории Intel. 35-летие процессора i386

Архив Intel продолжает напоминать нам о знаменательных страницах истории компании а их за прошедшие 50 с лишним лет было, как вы понимаете, немало. Сегодня мы перенесемся в середину восьмидесятых, а именно в 1985 год, когда Intel объявила о запуске своего нового процессора, получившего индекс 386.
Сколько инструкций процессора использует компилятор?

Месяц назад я попытался сосчитать, сколько разных инструкций поддерживается современными процессорами, и насчитал 945 в Ice Lake. Комментаторы затронули интересный вопрос: какая часть всего этого разнообразия реально используется компиляторами? Например, некто Pepij

Powerpc

Сервер Haute Couture обзор Apple Xserve G4

Компания Apple одна из самых заметных на компьютерном рынке, она же одна из самых противоречивых. Равнодушных к ее продукции и рыночной стратегии исчезающе мало ее либо любят, либо критикуют бывает и вовсе ненавидят. Ее продукты хорошо известны многим, интересующимся компь
Перевод Прекращайте покупать Макинтоши с процессором от Intel

По нашему мнению, Apple будет осуществлять техподдержку Mac на процессоре Intel не более пяти лет

В понедельник появились новости
Сколько инструкций процессора использует компилятор?

Месяц назад я попытался сосчитать, сколько разных инструкций поддерживается современными процессорами, и насчитал 945 в Ice Lake. Комментаторы затронули интересный вопрос: какая часть всего этого разнообразия реально используется компиляторами? Например, некто Pepijn

Sparc

Сколько инструкций процессора использует компилятор?

Месяц назад я попытался сосчитать, сколько разных инструкций поддерживается современными процессорами, и насчитал 945 в Ice Lake. Комментаторы затронули интересный вопрос: какая часть всего этого разнообразия реально используется компиляторами? Например, некто Pepij

X86_64

Перевод arm64 vs x86_64 для php

В связи со скорым стартом курса PHP-разработчик делимся с вами традиционным переводом материала. Приглашаем также посмотреть запись демо-урока Экосистема PHP.
ARM сервера более производительные и более дешёвые

В этом году Apple потрясла рынок десктопных процессоров чипом Apple M1 и устройствами на нём. Похожее событие произошло в мире облачных вычислений в прошлом году. AWS выпустили новый тип сервера на собственных ARM процессорах Graviton2. По заявлениям Amazon, соотношение производительности к цене у новых процессоров на 40% выше, чем у аналогов на x86. Ещё одно недавнее обновление - сервера Amazon RDS (облачный сервис, предоставляющи
Сколько инструкций процессора использует компилятор?

Месяц назад я попытался сосчитать, сколько разных инструкций поддерживается современными процессорами, и насчитал 945 в Ice Lake. Комментаторы затронули интересный вопрос: какая часть всего этого разнообразия реально используется компиляторами? Например, некто Pepijn

Последние комментарии

Имя: Макс

24.08.2022 | 11:28

Я разраб в IT компании, работаю на арбитражную команду. Мы работаем с приламы и сайтами, при работе замечаются постоянные баны и лаги. Пацаны посоветовали сервис по анализу исходного кода,https://app Подробнее..
Имя: 9055410337

20.08.2022 | 17:41

поможем пишите в телеграм Подробнее..
Имя: sabbat

17.08.2022 | 20:42

Охренеть.. это просто шикарная статья, феноменально круто. Большое спасибо за разбор! Надеюсь как-нибудь с тобой связаться для обсуждений чего-либо) Подробнее..
Имя: Мария

09.08.2022 | 14:44

Добрый день. Если обладаете такой информацией, то подскажите, пожалуйста, где можно найти много-много материала по Yggdrasil и его уязвимостях для написания диплома? Благодарю. Подробнее..

Контакты
Обнаружили ошибку

Сколько инструкций процессора использует компилятор?

Сейчас читают

Assembler

Разместить FORTH в 512 байтах

Процессор, эмулирующий сам себя может быть быстрее самого себя

Duffs device или loop unrolling в Си своими руками

Туториал по FASM (Windows x32 APIWin32API), Hello world!

Коротко о FASM, ассемблере, WinAPI

Перевод Сравнение векторных расширений ARM и RISC-V

Сравнение векторного расширения RISC-V (RVV) и масштабируемого векторного расширения ARM (SVE/SVE2).

Перевод Перепрограммирование GameBoy за счёт бага в Pokemon Yellow

Визуализация данных

Геопространственное моделирование с применением методов машинного обучения

Автозаказ как сделать так, чтобы нужные продукты сами попадали на полки 17000 магазинов по всей стране

Как я пытался придумать новый подход к изучению алгоритмов через интерактивные визуализации

Анализируем слона вместе с коллегами

Перевод Как культура жителей города влияет на дизайн карт метро Нью-Йорк

Перевод 5 разных библиотек Python, которые сэкономят ваше время

Компиляторы

Разработка стековой виртуальной машины и компилятора под неё (часть III)

Перевод Rust 1.53.0 IntoIterator для массивов, quotquot в шаблонах, Unicode-идентификаторы, поддержка имени HEAD-ветки в Cargo

Перевод Компилятор всё оптимизирует? Ну уж нет

История портирования Reindexerа как покорить Эльбрус за 11 дней

Recovery mode Сборка ядра Linux 5.12.10 c LLVM 12 Clang и LTO оптимизацией

Перевод Sparkplug неоптимизирующий компилятор JavaScript в подробностях

Процессоры

Dreamstation собираем ретрокомпьютер мечты на платформе Socket 8

На пути к вершине Магма и Кузнечик на Эльбрусе

Cubique reloaded. Обзор сервера HP NetServer LH Pro

Внедрение DDR5 будет молниеносным к 2026 году новая память займет 90 рынка

История портирования Reindexerа как покорить Эльбрус за 11 дней

Серия Intel Core 11000B 10 нм для компактных ПК

Статистика в it

Перевод Plt0.05, и откуда оно (иногда) берётся

Видеокарты продолжат дорожать накрутка при помощи посредников, нехватка мощностей и геймеры

AB-тест в инженерно-геологических изысканиях на языке Python

1. Введение

Перевод В офисе полный рабочий день? Нет, спасибо, говорят 86 процентов IT специалистов

Банкам стоит передавать данные клиентов внешним компаниям (но не с целью их продажи, и не всем)

Банки потеряют своих клиентов. Банки не потеряют своих клиентов

Aarch64