V tomto tutoriáli sa naučíte vytvárať, formátovať, upravovať a mazať reťazce v Pythone. Tiež vás oboznámia s rôznymi operáciami a funkciami reťazca.
Video: Python Strings
Čo je to reťazec v Pythone?
Reťazec je postupnosť znakov.
Postava je jednoducho symbol. Napríklad anglický jazyk má 26 znakov.
Počítače sa nezaoberajú znakmi, ale číslami (binárnymi). Aj keď na obrazovke vidíte znaky, vnútorne sa ukladá a manipuluje sa s nimi ako s kombináciou 0 a 1 s.
Táto premena znaku na číslo sa nazýva kódovanie a opačným procesom je dekódovanie. ASCII a Unicode sú niektoré z populárnych použitých kódovaní.
V Pythone je reťazec postupnosťou znakov Unicode. Bol zavedený kód Unicode, ktorý obsahuje všetky znaky vo všetkých jazykoch a zaisťuje jednotnosť kódovania. O Unicode sa môžete dozvedieť z Python Unicode.
Ako vytvoriť reťazec v Pythone?
Reťazce je možné vytvoriť vložením znakov do jednej úvodzovky alebo dvojitých úvodzoviek. V Pythone je možné použiť dokonca aj trojité úvodzovky, ale všeobecne sa používajú na vyjadrenie viacriadkových reťazcov a dokumentov.
# defining strings in Python # all of the following are equivalent my_string = 'Hello' print(my_string) my_string = "Hello" print(my_string) my_string = '''Hello''' print(my_string) # triple quotes string can extend multiple lines my_string = """Hello, welcome to the world of Python""" print(my_string)
Po spustení programu bude výstup:
Ahoj Ahoj Ahoj Ahoj, vitaj vo svete Pythonu
Ako získať prístup k znakom v reťazci?
K jednotlivým znakom môžeme pristupovať pomocou indexovania a k radu znakov pomocou krájania. Index začína od 0. Pokus o prístup k znaku mimo rozsahu indexu zvýši hodnotu IndexError
. Index musí byť celé číslo. Nemôžeme použiť plaváky ani iné typy, výsledkom bude TypeError
.
Python umožňuje negatívne indexovanie svojich sekvencií.
Index -1
odkazuje na poslednú položku, -2
na druhú poslednú položku atď. K množstvu položiek v reťazci môžeme získať prístup pomocou operátora krájania :
(dvojbodka).
#Accessing string characters in Python str = 'programiz' print('str = ', str) #first character print('str(0) = ', str(0)) #last character print('str(-1) = ', str(-1)) #slicing 2nd to 5th character print('str(1:5) = ', str(1:5)) #slicing 6th to 2nd last character print('str(5:-2) = ', str(5:-2))
Keď spustíme vyššie uvedený program, dostaneme nasledujúci výstup:
str = programiz str (0) = p str (-1) = z str (1: 5) = rogr str (5: -2) = am
Ak sa pokúsime získať prístup k indexu mimo rozsah alebo použiť iné čísla ako celé číslo, zobrazia sa chyby.
# index must be in range >>> my_string(15)… IndexError: string index out of range # index must be an integer >>> my_string(1.5)… TypeError: string indices must be integers
Krájanie je možné najlepšie vizualizovať zvážením indexu medzi prvkami, ako je uvedené nižšie.
Ak chceme získať prístup k rozsahu, potrebujeme index, ktorý odreže časť z reťazca.

Ako zmeniť alebo vymazať reťazec?
Struny sú nemenné. To znamená, že prvky reťazca nie je možné po priradení zmeniť. Môžeme jednoducho priradiť rôzne reťazce k rovnakému názvu.
>>> my_string = 'programiz' >>> my_string(5) = 'a'… TypeError: 'str' object does not support item assignment >>> my_string = 'Python' >>> my_string 'Python'
Z reťazca nemôžeme mazať ani mazať znaky. Celé vymazanie reťazca je ale možné pomocou del
kľúčového slova.
>>> del my_string(1)… TypeError: 'str' object doesn't support item deletion >>> del my_string >>> my_string… NameError: name 'my_string' is not defined
Operácie s reťazcami Python
Existuje veľa operácií, ktoré je možné vykonať pomocou reťazcov, čo z neho robí jeden z najpoužívanejších dátových typov v Pythone.
Ak sa chcete dozvedieť viac informácií o dátových typoch dostupných v Pythone, navštívte stránku: Python Data Types
Zreťazenie dvoch alebo viacerých reťazcov
Spojenie dvoch alebo viacerých reťazcov do jednej sa nazýva zreťazenie.
+ Operátor to robí v jazyku Python. Jednoduché spojenie dvoch reťazcových literálov ich tiež spojí.
* Operátor môže byť použitý na opakovanie reťazec pre daný počet opakovaní.
# Python String Operations str1 = 'Hello' str2 ='World!' # using + print('str1 + str2 = ', str1 + str2) # using * print('str1 * 3 =', str1 * 3)
Keď spustíme vyššie uvedený program, dostaneme nasledujúci výstup:
str1 + str2 = HelloWorld! str1 * 3 = HelloHelloHello
Zápis dvoch reťazcových literálov dohromady ich tiež spojí ako operátor + .
Ak chceme zreťaziť reťazce v rôznych riadkoch, môžeme použiť zátvorky.
>>> # two string literals together >>> 'Hello ''World!' 'Hello World!' >>> # using parentheses >>> s = ('Hello '… 'World') >>> s 'Hello World'
Iterácia cez reťazec
Môžeme iterovať pomocou reťazca pomocou slučky for. Tu je príklad na spočítanie počtu znakov „l“ v reťazci.
# Iterating through a string count = 0 for letter in 'Hello World': if(letter == 'l'): count += 1 print(count,'letters found')
Keď spustíme vyššie uvedený program, dostaneme nasledujúci výstup:
Nájdené 3 písmená
Sláčikový test členstva
We can test if a substring exists within a string or not, using the keyword in
.
>>> 'a' in 'program' True >>> 'at' not in 'battle' False
Built-in functions to Work with Python
Various built-in functions that work with sequence work with strings as well.
Some of the commonly used ones are enumerate()
and len()
. The enumerate()
function returns an enumerate object. It contains the index and value of all the items in the string as pairs. This can be useful for iteration.
Similarly, len()
returns the length (number of characters) of the string.
str = 'cold' # enumerate() list_enumerate = list(enumerate(str)) print('list(enumerate(str) = ', list_enumerate) #character count print('len(str) = ', len(str))
When we run the above program, we get the following output:
list(enumerate(str) = ((0, 'c'), (1, 'o'), (2, 'l'), (3, 'd')) len(str) = 4
Python String Formatting
Escape Sequence
If we want to print a text like He said, "What's there?", we can neither use single quotes nor double quotes. This will result in a SyntaxError
as the text itself contains both single and double quotes.
>>> print("He said, "What's there?"")… SyntaxError: invalid syntax >>> print('He said, "What's there?"')… SyntaxError: invalid syntax
One way to get around this problem is to use triple quotes. Alternatively, we can use escape sequences.
An escape sequence starts with a backslash and is interpreted differently. If we use a single quote to represent a string, all the single quotes inside the string must be escaped. Similar is the case with double quotes. Here is how it can be done to represent the above text.
# using triple quotes print('''He said, "What's there?"''') # escaping single quotes print('He said, "What\'s there?"') # escaping double quotes print("He said, "What's there? "")
When we run the above program, we get the following output:
He said, "What's there?" He said, "What's there?" He said, "What's there?"
Here is a list of all the escape sequences supported by Python.
Escape Sequence | Description |
---|---|
ewline | Backslash and newline ignored |
\ | Backslash |
\' | Single quote |
" | Double quote |
a | ASCII Bell |
ASCII Backspace | |
f | ASCII Formfeed |
ASCII Linefeed | |
ASCII Carriage Return | |
ASCII Horizontal Tab | |
v | ASCII Vertical Tab |
ooo | Character with octal value ooo |
xHH | Character with hexadecimal value HH |
Here are some examples
>>> print("C:\Python32\Lib") C:Python32Lib >>> print("This is printedin two lines") This is printed in two lines >>> print("This is x48x45x58 representation") This is HEX representation
Raw String to ignore escape sequence
Sometimes we may wish to ignore the escape sequences inside a string. To do this we can place r
or R
in front of the string. This will imply that it is a raw string and any escape sequence inside it will be ignored.
>>> print("This is x61 good example") This is a good example >>> print(r"This is x61 good example") This is x61 good example
The format() Method for Formatting Strings
The format()
method that is available with the string object is very versatile and powerful in formatting strings. Format strings contain curly braces ()
as placeholders or replacement fields which get replaced.
We can use positional arguments or keyword arguments to specify the order.
# Python string format() method # default(implicit) order default_order = "(), () and ()".format('John','Bill','Sean') print('--- Default Order ---') print(default_order) # order using positional argument positional_order = "(1), (0) and (2)".format('John','Bill','Sean') print('--- Positional Order ---') print(positional_order) # order using keyword argument keyword_order = "(s), (b) and (j)".format(j='John',b='Bill',s='Sean') print('--- Keyword Order ---') print(keyword_order)
When we run the above program, we get the following output:
--- Default Order --- John, Bill and Sean --- Positional Order --- Bill, John and Sean --- Keyword Order --- Sean, Bill and John
The format()
method can have optional format specifications. They are separated from the field name using colon. For example, we can left-justify <
, right-justify >
or center ^
a string in the given space.
Celé čísla môžeme tiež formátovať ako binárne, hexadecimálne atď. A pohyblivé znaky môžu byť zaokrúhlené alebo zobrazené vo formáte exponentu. Existuje veľa formátovania, ktoré môžete použiť. Navštívte tu všetky formátovanie reťazcov dostupné pri použití tejto format()
metódy.
>>> # formatting integers >>> "Binary representation of (0) is (0:b)".format(12) 'Binary representation of 12 is 1100' >>> # formatting floats >>> "Exponent representation: (0:e)".format(1566.345) 'Exponent representation: 1.566345e+03' >>> # round off >>> "One third is: (0:.3f)".format(1/3) 'One third is: 0.333' >>> # string alignment >>> "|(:10)|".format('butter','bread','ham') '|butter | bread | ham|'
Formátovanie v starom štýle
Môžeme dokonca naformátovať reťazce ako starý sprintf()
štýl používaný v programovacom jazyku C. Na %
dosiahnutie tohto cieľa používame operátora.
>>> x = 12.3456789 >>> print('The value of x is %3.2f' %x) The value of x is 12.35 >>> print('The value of x is %3.4f' %x) The value of x is 12.3457
Bežné reťazcové metódy Pythonu
S reťazcovým objektom je k dispozícii veľa metód. format()
Metóda, ktorá sme sa zmienili vyššie, je jedným z nich. Niektoré z bežne používaných metód lower()
, upper()
, join()
, split()
, find()
, replace()
atď. Tu je kompletný zoznam všetkých vstavaných metód pre prácu s reťazcami v Pythone.
>>> "PrOgRaMiZ".lower() 'programiz' >>> "PrOgRaMiZ".upper() 'PROGRAMIZ' >>> "This will split all words into a list".split() ('This', 'will', 'split', 'all', 'words', 'into', 'a', 'list') >>> ' '.join(('This', 'will', 'join', 'all', 'words', 'into', 'a', 'string')) 'This will join all words into a string' >>> 'Happy New Year'.find('ew') 7 >>> 'Happy New Year'.replace('Happy','Brilliant') 'Brilliant New Year'