Как перебирать все символы ASCII в Bash?
Я знаю, как перебирать алфавиты:
for c in {a..z}; do ...; done
но я не могу понять, как перебирать все символы ASCII. Кто-нибудь знает как?
5 ответов
вы можете выполнить итерацию от 0 до 127, а затем преобразовать десятичное значение в его ASCII-значение(или обратно).
можно использовать эти функции для этого:
# POSIX
# chr() - converts decimal value to its ASCII character representation
# ord() - converts ASCII character to its decimal value
chr() {
[ -lt 256 ] || return 1
printf \$(printf '%03o' )
}
# Another version doing the octal conversion with arithmetic
# faster as it avoids a subshell
chr () {
[ -lt 256 ] || return 1
printf \$((/64*100+%64/8*10+%8))
}
# Another version using a temporary variable to avoid subshell.
# This one requires bash 3.1.
chr() {
local tmp
[ -lt 256 ] || return 1
printf -v tmp '%03o' ""
printf \"$tmp"
}
ord() {
LC_CTYPE=C printf '%d' "'"
}
# hex() - converts ASCII character to a hexadecimal value
# unhex() - converts a hexadecimal value to an ASCII character
hex() {
LC_CTYPE=C printf '%x' "'"
}
unhex() {
printf \x""
}
# examples:
chr $(ord A) # -> A
ord $(chr 65) # -> 65
возможность использования только echo
s восьмеричные escape-последовательности:
for n in {0..7}{0..7}{0..7}; do echo -ne "\0$n"; done
вот как вы печатаете целое число как соответствующий символ ascii с awk
:
echo "65" | awk '{ printf("%c", ); }'
которая будет печатать:
A
и вот как вы можете перебирать прописные буквы таким образом:
# ascii for A starts at 65:
ascii=65
index=1
total=26
while [[ $total -ge $index ]]
do
letter=$(echo "$ascii" | awk '{ printf("%c", ); }')
echo "The $index'th letter is $letter"
# Increment the index counter as well as the ascii counter
index=$((index+1))
ascii=$((ascii+1))
done
вот что я придумал для однострочного взятия некоторых частей из ответов Сампсона-Чена и маты:
for n in {0..127}; do awk '{ printf("%c", ); }' <<< $n; done
или же:
for n in {0..127}; do echo $n; done | awk '{ printf("%c", ); }'
хорошо... Если вы действительно хотите их всех, и вы хотите, чтобы это было что-то вроде сценария, вы могли бы сделать это, я думаю:
awk 'function utf32(i) {printf("%c%c%c%c",i%0x100,i/0x100%0x100,i/0x10000%0x100,i/0x1000000) } BEGIN{for(i=0;i<0x110000;i++){utf32(i);utf32(0xa)}}' | iconv --from-code=utf32 --to-code=utf8 | grep -a '[[:print:]]'
но список довольно огромен и не очень полезен. Awk может быть не самым элегантным способом генерации двоичных целых чисел от 0 до 0x110000 - замените что-то более элегантное, если вы его найдете.
Edit: О, я вижу, вы хотели только ascii. Ну, я позволю этому ответу остаться здесь, Если кто-то другой действительно хочет всю UTF printable письмена.