Что такое пещера кода, и есть ли какое-либо законное использование для нее?

Question

Что такое пещера кода, и есть ли какое-либо законное использование для нее?

Я впервые столкнулся с этим словом в вопросе StackOverflow"C# теоретический: напишите JMP в кодекаве в asm.- Я вижу это по Wiktionary, пещера код:

неиспользуемый блок памяти, который кто-то, как правило, взломщик программного обеспечения, может использовать для инъекции пользовательский программный код для изменения поведения программы.

нашел ли я правильное определение? Если да, то есть ли законное применение для кодовой пещеры?

25

assembly codecave definition self-modifying terminology

автор: Community

9 ответов

автор: Rob Kennedy · Accepted Answer · 2009-04-24 19:45:03

я использовал их, хотя я никогда не слышал термин пещера код до сегодняшнего дня. Определение Wiktionary предполагает, что пещера кода-это то, что взломщик находит в исполняемом файле, который он или она пытается взломать. Вопрос, который вы цитируете, не использует его таким образом. Вместо этого он предполагает, что пещера кода выделяется с VirtualAllocEx создать новый блок памяти в целевом процессе. Это устраняет необходимость поиска неиспользуемого пространства в цели и гарантирует, что вы есть достаточно места, чтобы поместить весь ваш новый код.

в конечном счете, я думаю "пещера кода" -это просто место для хранения кода, сгенерированного во время выполнения. В этом кодексе не должно быть никакой гнусной цели. И в этот момент вопрос о том, что такое кодовая пещера, становится совершенно неинтересным. Интересные части - это причины создания кода во время выполнения и методы, позволяющие убедиться, что новый код запускается, когда вы этого хотите.

автор: chaos · Accepted Answer · 2009-04-24 18:58:08

можно было бы намеренно создать пещеру кода в рамках использования самомодифицирующийся код.

предполагая, конечно, что это безумие.

автор: Unknown · Accepted Answer · 2009-04-24 20:55:38

пещеры кода обычно создаются компиляторами для трассы и часто расположены между функциями в огромных количествах. Также должны быть кодовые пещеры между структурами и переходами (в некоторых архитектурах), но обычно не в значительных количествах.

вы также можете искать блок обнуленной памяти, но нет никакой гарантии, что программа не будет их использовать.

Я полагаю, теоретически, если вы потеряли исходный код, вы можете исправить свой багги программы, используя их, и ваша программа не будет расти в размерах.

редактировать

для тех из вас, кто предлагает пещеры кода, предназначены только для кода, генерируемого во время выполнения: это неполное определение. Много раз я писал структуру данных в "пещере кода" и обновлял указатели, чтобы указать туда, и я подозреваю, что я не единственный человек, который это делает.

автор: Dustin Getz · Accepted Answer · 2009-04-24 19:42:08

некоторые законные использует: исправление двоичных файлов Live OS без перезагрузки (MS делает это), подключение низкоуровневых функций ОС (файловая система, сеть) для брандмауэра и антивируса, расширение приложения, когда у вас нет исходного кода (например, очистка низкоуровневых вызовов ОС для DrawText, чтобы вы могли читать их вслух для слепых)

автор: Dan · Accepted Answer · 2009-04-24 19:13:20

Как это описано здесь напоминает мне patchpoints -- законно использовать.

автор: DanM · Accepted Answer · 2009-04-24 19:16:54

незнакомый с термином, но механизмы горячего исправления могут использовать зарезервированное пространство для хранения исправлений кода. Вы подключаетесь к дефектной функции и перенаправляете ее на новую улучшенную функцию. Это можно сделать на лету, не снимая критическое оборудование (большие телекоммуникационные коммутаторы).

автор: jfclavette · Accepted Answer · 2009-04-24 18:57:57

его можно использовать для вставки кода во время выполнения. Его можно использовать для написания самомодифицирующегося кода на статических языках, предполагая, что ОС позволяет вам (NX бит не установлен и т. д.). Есть использование для него, но это не то, о чем вы должны думать в своем типичном бизнес-приложении.

автор: e.James · Accepted Answer · 2009-04-24 19:07:07

звучит как правильное определение для меня.

нет никакого способа, чтобы этот тип вещей должен когда-нибудь перейти в производственный код:

это огромная потенциальная проблема безопасности. Если можно ввести код в память, а затем выполнить его, a злоумышленник теоретически может делать, Ну, все, что угодно.
это кошмар обслуживания кода и кошмар отладки. Если код, который в конечном итоге запускается, может измениться во время выполнения, становится почти невозможно отслеживать ошибки и ошибки.

автор: Stephen C. Steel · Accepted Answer · 2009-04-24 19:38:05

Самомодифицирующийся код не следует рассматривать легко, но иногда может принести большой прирост производительности. Если вы программируете очень долго, вы, вероятно, использовали его, не осознавая этого.

до широкого использования 486 и выше многие ПК не включали аппаратную плавающую поддержку. Это оставило людей, пишущих программы с плавающей точкой с дилеммой. Если они скомпилировали свою программу для использования встроенных инструкций с плавающей запятой, она будет работать быстро на машина с процессором с плавающей запятой, и совсем не на машинах без одного. Если они скомпилируют свою программу с эмуляцией программного обеспечения с плавающей запятой, она будет работать на всех машинах, но медленно даже на машинах с плавающей запятой.

многие библиотеки компиляторов использовали интересный трюк с самомодифицирующимся кодом. Поведение по умолчанию заключалось в том, чтобы поместить инструкцию trap, где необходима операция с плавающей запятой. Обработчик ловушек будет либо эмулировать инструкцию в программном обеспечении, или, если он обнаружил, что он работает на машине с оборудованием с плавающей запятой, он изменит код, заменив инструкцию trap соответствующей инструкцией с плавающей запятой и выполнит ее. Результатом стало программное обеспечение, которое работало на всех машинах и работало почти так же быстро на машине с оборудованием с плавающей запятой, как если бы код был скомпилирован для использования оборудования с плавающей запятой напрямую (поскольку большинство интенсивных операций с плавающей запятой происходят в циклах, которые выполняются много раз).