Ассемблер отражает машинные команды процессора.
Обычно команды делают переменной длины,
и вроде как это разумно,
так как объем кода может быть поменьше,
чем если бы для всех команд была фиксированная длина,
но парсить код из команд переменной длины сложнее.
В идеале регистры процессора и его команды
надо разработать так,
чтобы код (один и тот же функционал) был максимально коротким по количеству байтов.
Не надеяться на терабайты современной памяти,
а стремиться к наимаксимальнейшему (предельному) сокращению объема используемой памяти.
Тогда код будет выполняться быстро хоть на процессоре сорокалетней давности.
Для повышения скорости вычислений (как минимум на 50 %)
конкретного кода нужно
создать процессор, в котором можно "на лету" менять байты команд.
Но такой процессор, как мне кажется, будет трудоемко рассчитать,
да и надо на сто раз проверить целесообразность его изготовления.
Грубо говоря, стоит ли овчинка выделки или
это влажные мечты воспаленного от жары головного мозга автора этого поста?