next up previous index
Következő: 15.50.8.3 Egybeolvasott szimbólumok Fel: 15.50.8 MINTÁK ÉS TEVÉKENYSÉGEK Előző: 15.50.8.1 Minták   Index

15.50.8.2 Reguláris kifejezések

A reguláris kifejezések az egrep-ben megtalálható kibővített típusúak. A következő karakterekből állnak:
c
a nem-metakarakter c-re illeszkedik.
¸
a literális c karakterre illeszkedik.
.
minden karakterre illeszkedik, beleértve az újsort.
^
egy sztring kezdetére illeszkedik.
$
egy sztring végére illeszkedik.
[abc...]
karakterlista, amely az abc...karakterek bármelyikére illeszkedik.
[^abc...]
negált karakterlista, minden karakterre illeszkedik, kivéve abc...-t.
r1|r2
vagylagosság: r1-re vagy r2-re illeszkedik.
r1r2
összekapcsolás: az r1 és r2 sorozatra illeszkedik.
r+
egy vagy több r-re illeszkedik.
r*
nulla vagy több r-re illeszkedik.
r?
nulla vagy egy r-re illeszkedik.
(r)
csoportosítás: r-re illeszkedik.
r{n}
r{n,}
r{n,m}
Egy vagy két szám kapcsos zárójelek között intervallum-kifejezést jelent. Ha egy szám szerepel a zárójelek között, az előtte álló r reguláris kifejezés n-szer megismétlődik. Ha két szám van zárójelezve, vesszővel elválasztva, rnés m közötti számszor ismétlődik meg. Ha egy számot követ vessző, ez r legalább n-szeri ismétlését jelzi. Az intervallum-kifejezések csak akkor használhatók, ha a parancssorban -posix vagy -re-interval opciót jelölünk meg.
\y
egyszó elején vagy végén álló üres sztringre illeszkedik.
\B
egyszón belüli üres sztringre illeszkedik.
\<
egyszó elején álló üres sztringre illeszkedik.
\>
egyszó végén álló üres sztringre illeszkedik.
\w
minden szóalkótó karakterre (betű, szám, aláhúzás) illeszkedik.
\W
minden nem-szóalkótó karakterre illeszkedik.
\`
egypuffer (sztring) elején álló üres sztringre illeszkedik.
\'
egypuffer végén álló üres sztringre illeszkedik.

A sztringkonstansokban érvényes escape szekvenciák (lásd lejjebb) szintén használhatók a reguláris kifejezésekben.

A karakterosztály a POSIX szabványban bevezetett új lehetőség. A karakterosztály egy speciális jelölés adott attribútumú karakterek leírásához, ahol viszont a tulajdonképpeni karakterek ország és ország és/vagy karakterkészlet és karakterkészlet között mások lehetnek. Például az alfabetikus karakter fogalma mást jelent az USA­ban és mást Franciaországban. A karakterosztályok csak a karakterlista szögletes zárójelein belüli reguláris kifejezésben használhatók. Formájuk: [:, az osztályt jelölő kulcsszó és :]. Íme a POSIX szabványban definiált karakterosztályok.

[:alnum:]
Alfanumerikus karakterek.
[:alpha:]
Alfabetikus karakterek.
[:blank:]
Space vagy tab karakterek.
[:cntrl:]
Vezérlő karakterek.
[:digit:]
Numerikus karakterek.
[:graph:]
Látható és nyomtatható karakterek. (A space nyomtatható, de nem látható, míg egy a mindkettő.)
[:lower:]
Kisbetűs alfabetikus karakterek.
[:print:]
Nyomtatható karakterek (nem vezérlő karakterek.)
[:punct:]
Írásjelek (nem betű-, szám-, vezérlő vagy space karakterek).
[:space:]
Space karakterek (úgy mint például space, tab és lapdobás).
[:upper:]
Nagybetűs alfabetikus karakterek.
[:xdigit:]
Hexadecimális számkarakterek.

Példának okáért, a POSIX szabvány előtt, az alfanumerikus karakterekre illeszkedést a /[A-Za-z0-9]/ leírásával lehetett volna elérni. Ha karakterkészletünkben egyéb alfabetikus karakterek is vannak, ez nem fog illeszkedni rájuk. A POSIX karakterosztályt használvaa/[[:alnum:]]/ forma illeszkedni fog a karakterkészlet minden alfabetikus és numerikus karakterére. Két további speciális szekvencia is megjelenhet a karakterlistákban. Ezek nem-ASCII karakterkészletekre vonatkoznak, amelyeknek lehetnek olyan szimbólumaik (egybeolvasott elemek), amelyek több, mint egy karakterrel vannak ábrázolva, és számos olyan karakter is, amelyek összehasonlító vagy rendező szempontból egyenértékűek. (pl. a francia nyelvben a sima ,,e'' és a tompaékezetes e` egyenértékűek.)


next up previous index
Következő: 15.50.8.3 Egybeolvasott szimbólumok Fel: 15.50.8 MINTÁK ÉS TEVÉKENYSÉGEK Előző: 15.50.8.1 Minták   Index

1999-09-17