Детали по теме базовое обучение: awk синтаксис, Awk команды, Awk скрипты, BASH скрипты

\t — означает символ табуляции

[] — обозначение множества символов (в регулярных выражениях) AWK работает с регулярными выражениями в подстроках поиска [:digit:] — множество символов, написано, что является аналогом множества символов: [0-9]

^ — в регулярном выражении означает отрицание

Знак доллара — $ — в конце регулярного выражения соответствует концу строки.

«^$» соответствует пустой строке.

«[xyz]» — один из перечисленных символов x, y или z.

«[c-n]» один из символов в диапазоне от c до n, включительно.

«[B-Pk-y]» — один любойсимвол в диапазоне от B до P или в диапазоне от k до y, включительно.

«[a-z0-9]» — один из символов латиницы в нижнем регистре или цифра.

«[^b-d]» — любой символ, кроме символов из диапазона от b до d, включительно. В данном случае, метасимвол ^ означает отрицание.

Если объединить выражения в квадратных скобках в одну последовательность, можно задать необходимое для поиска выражение. Например, выражение «[Yy][Ee][Ss]» соответствует словам yes, Yes, YES, yEs и так далее. Выражение «[0-9][0-9][0-9]-[0-9][0-9]-[0-9][0-9][0-9][0-9]» определяет шаблон для поиска любого номера карточки социального страхования (для США).

 

 

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *