Κατάλογος κανονικών εκφράσεων

Όρος

Αναπαράσταση/Χρήση

Οποιοσδήποτε χαρακτήρας

Ο δεδομένος χαρακτήρας, εκτός και είναι κανονική έκφραση μεταχαρακτήρα, που ακολουθεί σε αυτόν τον πίνακα.

.

Οποιοσδήποτε μοναδικός χαρακτήρας, εκτός από αλλαγή γραμμής ή παραγράφου. Παραδείγματος χάρη, ο όρος αναζήτησης "sh.rt" ταιριάζει και με "shirt" και με "short".

^

Η έναρξη παραγράφου ή κελιού. Ειδικά αντικείμενα όπως κενά πεδία ή πλαίσια αγκιστρωμένα σε χαρακτήρα, στην έναρξη παραγράφου παραβλέπονται. Παράδειγμα: "^Peter" ταιριάζει με τη λέξη "Peter" μόνο όταν είναι η πρώτη λέξη παραγράφου.

$

Το τέλος παραγράφου ή κελιού. Ειδικά αντικείμενα όπως κενά πεδία ή πλαίσια αγκιστρωμένα σε χαρακτήρα στο τέλος παραγράφου αγνοούνται. Παράδειγμα: "Peter$" ταιριάζει όνο όταν η λέξη "Peter" είναι η τελευταία λέξη παραγράφου, σημειώστε ότι το "Peter" δεν μπορεί να ακολουθείτε από τελεία.

$ από μόνο του ταιριάζει στο τέλος της παραγράφου. Με αυτόν τον τρόπο είναι δυνατή η αναζήτηση και αντικατάσταση αλλαγών παραγράφου.

*

Μηδέν ή περισσότεροι όροι κανονικών εκφράσεων προηγούνται αμέσως. Παραδείγματος χάρη, "Ab*c" ταιριάζει με "Ac", "Abc", "Abbc", "Abbbc", κ.ο.κ.

+

Ένας ή περισσότεροι όροι κανονικών εκφράσεων προηγούνται αμέσως. Παραδείγματος χάρη, "AX.+4" βρίσκει "AXx4", αλλά όχι "AX4".

Η μεγαλύτερη δυνατή συμβολοσειρά που ταιριάζει με αυτήν την κανονική έκφραση σε παράγραφο ταιριάζει πάντα. Εάν η παράγραφος περιέχει τη συμβολοσειρά "AX 4 AX4", επισημαίνεται ολόκληρη η παράγραφος.

?

Μηδέν ή ένας όρος κανονικής έκφρασης προηγείται άμεσα. Παραδείγματος χάρη, "Texts?" ταιριάζει με "Text" και "Texts"και το "x(ab|c)?y" βρίσκει "xy", "xaby", ή "xcy".

\

Ο ειδικός χαρακτήρας που ακολουθεί, ερμηνεύεται ως κανονικός χαρακτήρας και όχι ως μεταχαρακτήρας κανονικής έκφρασης (εκτός από τους συνδυασμούς "\n", "\t", "\b", "\>" και "\<"). Παραδείγματος χάρη, "tree\." ταιριάζει με "tree.", όχι με "treed" ή "trees".

\n

Εισήχθη αλλαγή γραμμής με τον συνδυασμό πλήκτρων Shift+Enter όταν ήταν στο πλαίσιο κειμένου Εύρεση.

Αλλαγή παραγράφου μπορεί να εισαχθεί με το πλήκτρο Enter ή Return όταν είναι στο πλαίσιο κειμένου Αντικατάσταση.

Για τροποποίηση αλλαγών γραμμής σε αλλαγές παραγράφου, εισάγετε \n και στα δύο πλαίσια Εύρεση και Αντικατάσταση και έπειτα εκτελέστε αναζήτηση και αντικατάσταση.

\t

Χαρακτήρας στηλοθέτη. Μπορεί να χρησιμοποιηθεί επίσης στο πλαίσιο Αντικατάσταση.

\b

Όριο λέξης. Παραδείγματος χάρη, "\bbook" ταιριάζει με "bookmark" και "book" αλλά όχι με "checkbook", ενώ "book\b" ταιριάζει με "checkbook" και "book" αλλά όχι με "bookmark".

Σημειώστε, αυτή η μορφή αντικαθιστά τις καταργημένες μορφές (αν και δουλεύουν ακόμα προς το παρόν) "\>" (συμφωνία τέλους λέξης) και "\<" (συμφωνία έναρξης λέξης).

^$

Εντοπίζει μια κενή παράγραφο.

^.

Εντοπίζει τον πρώτο χαρακτήρα μιας παραγράφου.

& ή $0

Προσθέτει τη συμβολοσειρά που βρέθηκε από τα κριτήρια αναζήτησης στο πλαίσιο Εύρεση στον όρο στο πλαίσιο Αντικατάσταση, όταν κάνετε αντικατάσταση.

Παραδείγματος χάρη, εάν εισάγετε "window" στο πλαίσιο Εύρεση και "&frame" στο πλαίσιο Αντικατάσταση, η λέξη "window" αντικαθίσταται από "windowframe".

Μπορείτε επίσης να εισάγετε ένα "&" στο πλαίσιο Αντικατάσταση για να τροποποιήσετε το Γνωρίσματα ή στο Μορφή της συμβολοσειράς που βρέθηκε από τα κριτήρια αναζήτησης.

[...]

Οποιαδήποτε μοναδική εμφάνιση οποιουδήποτε ενός χαρακτήρα που είναι μεταξύ των παρενθέσεων. Παραδείγματος χάρη: "[abc123]" ταιριάζει με τους χαρακτήρες ‘a’, ‘b’, ’c’, ‘1’, ‘2’ και ‘3’. "[a-e]" ταιριάζει με μοναδικές εμφανίσεις των χαρακτήρων a μέχρι e, συμπεριλαμβανόμενων (η περιοχή πρέπει να οριστεί με τον χαρακτήρα που έχει τον μικρότερο αριθμό κώδικα Unicode πρώτα). Το "[a-eh-x]" ταιριάζει με οποιαδήποτε μοναδική εμφάνιση χαρακτήρων που είναι στις περιοχές ‘a’ μέχρι και ‘e’ και ‘h’ μέχρι και ‘x’.

[^...]

Επιτρέπεται οποιαδήποτε μοναδική εμφάνιση χαρακτήρα, συμπεριλαμβανομένων χαρακτήρων στηλοθετών, διαστημάτων και αλλαγών γραμμών, που δεν είναι στον κατάλογο χαρακτήρων που καθορίστηκαν στις συμπεριλαμβανόμενες περιοχές. Παραδείγματος χάρη, "[^a-syz]" ταιριάζει με όλους τους χαρακτήρες που δεν είναι στην περιεχόμενη περιοχή ‘a’ μέχρι και ‘s’ ή τους χαρακτήρες ‘y’ και ‘z’.

\uXXXX

\UXXXXXXXX

Ο χαρακτήρας αναπαριστάνεται με τον τετραψήφιο δεκαεξαδικό κωδικό Unicode (XXXX).

Ο χαρακτήρας αναπαριστάνεται από τον οκταψήφιο δεκαεξαδικό κώδικα Unicode (XXXXXXXX).

Για συγκεκριμένες γραμματοσειρές συμβόλων ο κωδικός Unicode για ειδικούς χαρακτήρες μπορεί να εξαρτάται από την χρησιμοποιούμενη γραμματοσειρά. Οι κωδικοί Unicode μπορούν να προβληθούν επιλέγοντας Εισαγωγή - Ειδικός χαρακτήρας.

|

Ο ενθεματικός τελεστής περιορίζει τις εναλλακτικές. Ταιριάζει τον όρο που προηγείται με το "|", ή τον όρο που ακολουθεί με το "|". Παραδείγματος χάρη, "this|that" ταιριάζει με τις εμφανίσεις και των δύο "this" και "that".

{N}

The post-fix repetition operator that specifies an exact number of occurrences ("N") of the regular expression term immediately preceding it must be present for a match to occur. For example, "tre{2}" matches "tree".

{N,M}

The post-fix repetition operator that specifies a range (minimum of "N" to a maximum of "M") of occurrences of the regular expression term immediately preceding it that can be present for a match to occur. For example, "tre{1,2}" marches "tre" and "tree".

{N,}

The post-fix repetition operator that specifies a range (minimum "N" to an unspecified maximum) of occurrences of the regular expression term immediately preceding it that can be present for a match to occur. (The maximum number of occurrences is limited only by the size of the document). For example, "tre{2,}" matches "tree", "treee", and "treeeee".

(...)

The grouping construct that serves three purposes.

  1. To enclose a set of ‘|’ alternatives. For example, the regular expression "b(oo|ac)k" matches both "book" and "back".

  2. To group terms in a complex expression to be operated on by the post-fix operators: "*", "+" and "?" along with the post-fix repetition operators. For example, the regular expression "a(bc)?d" matches both "ad" and "abcd" in a search.; the regular expression "M(iss){2}ippi" matches "Mississippi".

  3. To record the matched sub string inside the parentheses as a reference for later use in the Find box using the "\n" construct or in the Replace box using the "$n" construct, where the reference to the first matched sub string in the current expression in the Find box is represented by "\1" in the Find box and by "$1" in the Replace box, the reference to the second matched sub string by "\2" and "$2" respectively, and so on.

For example, the regular expression "(890)7\1\1" matches "8907890890".

With the regular expression "\b(fruit|truth)\b" in the Find box and the regular expression "$1ful" in the Replace box occurrences of the words "fruit" and "truth" can be replaced with the words "fruitful" and "truthful" respectively without affecting the words "fruitfully" and "truthfully"

[:alpha:]

Αντιπροσωπεύει έναν αλφαβητικό χαρακτήρα. Χρησιμοποιήστε το [:alpha:]+ για να βρείτε έναν από αυτούς.

[:digit:]

Αντιπροσωπεύει δεκαδικό ψηφίο. Χρησιμοποιήστε το [:digit:]+ για να βρείτε ένα από αυτά.

[:alnum:]

Βρίσκει αλφαριθμητικούς χαρακτήρες ([:alpha:] και [:digit:]).

[:space:]

Αναπαριστά ένα χαρακτήρα διαστήματος (αλλά όχι άλλους χαρακτήρες με λευκό χρώμα).

[:print:]

Βρίσκει εκτυπώσιμους χαρακτήρες.

[:cntrl:]

Βρίσκει μη εκτυπώσιμους χαρακτήρες.

[:lower:]

Βρίσκει πεζούς χαρακτήρες αν επιλέξετε Ακριβής αναζήτηση από τις Επιλογές .

[:upper:]

Αναπαριστά έναν κεφαλαίο χαρακτήρα εάν το Ταίριασμα πεζών/κεφαλαίων είναι επιλεγμένο στις Επιλογές.


Για πλήρη κατάλογο των υποστηριζόμενων μεταχαρακτήρων και σύνταξης δείτε ICU Regular Expressions documentation (αγγλικά)

Note that currently all named character class terms, [:alpha:] through [:upper:], must be enclosed in parentheses when used in a regular expression, see the examples that follow.

Regular expression terms can be combined to form complex and sophisticated regular expressions for searches as show in the following examples.

Παραδείγματα

Expression

Meaning

^$

An empty paragraph.

^ specifies that the match must be at the start of a paragraph,

$ specifies that a paragraph mark or the end of a cell must follow the matched string.

^.

The first character of a paragraph.

^ specifies that the match must be at the start of a paragraph,

. specifies any single character.

e([:digit:])?

Matches "e" by itself or an "e" followed by one digit.

e specifies the character "e",

[:digit:] specifies any decimal digit,

? specifies zero or one occurrences of [:digit:].

^([:digit:])$

Matches a paragraph or cells containing exactly one digit.

^ specifies that the match must be at the start of a paragraph,

[:digit:] specifies any decimal digit,

$ specifies that a paragraph mark or the end of a cell must follow the matched string.

^[:digit:]{3}$

Matches a paragraph or cell containing only three digit numbers

^ specifies that the match must be at the start of a paragraph,

[:digit:] specifies any decimal digit,

{3} specifies that [:digit:] must occur three times,

$ specifies that a paragraph mark or the end of a cell must follow the matched string.

\bconst(itu|ruc)tion\b

Matches the words "constitution" and "construction" but not the word "constitutional."

\b specifies that the match must begin at a word boundary,

const specifies the characters "const",

( starts the group,

itu specifies the characters "itu",

| specifies the alternative,

ruc specifies the characters "ruc",

) ends the group,

tion specifies the characters "tion",

/b specifies that the match must end at a word boundary.