Strune Python (z primeri)

V tej vadnici se boste naučili ustvarjati, formatirati, spreminjati in brisati nize v Pythonu. Prav tako se boste seznanili z različnimi nizovnimi operacijami in funkcijami.

Video: Python Strings

Kaj je String v Pythonu?

Niz je zaporedje znakov.

Znak je preprosto simbol. Angleški jezik ima na primer 26 znakov.

Računalniki se ne ukvarjajo z znaki, temveč s števili (binarno). Čeprav lahko na zaslonu vidite znake, se interno shrani in z njimi manipulira kot kombinacija 0 in 1.

Ta pretvorba znaka v številko se imenuje kodiranje, obratni postopek pa dekodiranje. ASCII in Unicode sta nekaj priljubljenih kodiranj.

V Pythonu je niz zaporedje znakov Unicode. Uvedena je bila Unicode, ki vključuje vse znake v vseh jezikih in zagotavlja enakomernost kodiranja. O Unicode lahko izveste v Python Unicode.

Kako ustvariti niz v Pythonu?

Strune lahko ustvarite tako, da v en narekovaj ali dvojne narekovaje zaprete znake. Tudi trojni narekovaji se lahko uporabljajo v Pythonu, vendar se običajno uporabljajo za predstavljanje večvrstičnih nizov in dokumentov.

 # defining strings in Python # all of the following are equivalent my_string = 'Hello' print(my_string) my_string = "Hello" print(my_string) my_string = '''Hello''' print(my_string) # triple quotes string can extend multiple lines my_string = """Hello, welcome to the world of Python""" print(my_string)

Ko zaženete program, bo rezultat:

 Pozdravljeni Pozdravljeni Pozdravljeni Pozdravljeni, dobrodošli v svetu Pythona

Kako dostopati do znakov v nizu?

Do posameznih znakov lahko dostopamo z indeksiranjem, do nabora znakov pa z rezanjem. Indeks se začne od 0. Če poskusite dostopati do znaka, ki ni iz območja indeksa, se bo dvignil znak IndexError. Indeks mora biti celo število. Ne moremo uporabljati plovcev ali drugih vrst, to bo povzročilo TypeError.

Python omogoča negativno indeksiranje svojih zaporedij.

Kazalo -1sklicevanja se nanaša na zadnjo postavko, -2na drugo zadnjo postavko itd. Do številnih elementov v nizu lahko dostopamo z operaterjem rezanja :(dvopičje).

 #Accessing string characters in Python str = 'programiz' print('str = ', str) #first character print('str(0) = ', str(0)) #last character print('str(-1) = ', str(-1)) #slicing 2nd to 5th character print('str(1:5) = ', str(1:5)) #slicing 6th to 2nd last character print('str(5:-2) = ', str(5:-2))

Ko zaženemo zgornji program, dobimo naslednji izhod:

 str = programiz str (0) = p str (-1) = z str (1: 5) = rogr str (5: -2) = am

Če poskusimo dostopati do indeksa zunaj obsega ali uporabimo številke, ki niso celo število, bomo dobili napake.

 # index must be in range >>> my_string(15)… IndexError: string index out of range # index must be an integer >>> my_string(1.5)… TypeError: string indices must be integers

Rezanje je mogoče najbolje vizualizirati, če upoštevamo, da je indeks med elementi, kot je prikazano spodaj.

Če želimo dostopati do obsega, potrebujemo indeks, ki bo del odrezal iz niza.

Rezanje nizov v Pythonu

Kako spremeniti ali izbrisati niz?

Strune so nespremenljive. To pomeni, da elementov niza ni mogoče spremeniti, ko so jim dodeljeni. Preprosto lahko različnim nizom dodelimo isto ime.

 >>> my_string = 'programiz' >>> my_string(5) = 'a'… TypeError: 'str' object does not support item assignment >>> my_string = 'Python' >>> my_string 'Python'

Znakov iz niza ni mogoče izbrisati ali odstraniti. Toda v celoti lahko niz izbrišete s delključno besedo.

 >>> del my_string(1)… TypeError: 'str' object doesn't support item deletion >>> del my_string >>> my_string… NameError: name 'my_string' is not defined

Python niz operacije

Obstaja veliko operacij, ki jih je mogoče izvesti z nizi, zaradi česar je eden najpogosteje uporabljenih podatkovnih vrst v Pythonu.

Če želite izvedeti več o podatkovnih tipih, ki so na voljo v Pythonu, obiščite: Python Data Types

Združevanje dveh ali več nizov

Združevanje dveh ali več nizov v en sam se imenuje združevanje.

+ Operater to stori v Python. Preprosto pisanje dveh nizovnih literal skupaj jih tudi poveže.

* Operater lahko uporablja ponoviti niz za določeno število krat.

 # Python String Operations str1 = 'Hello' str2 ='World!' # using + print('str1 + str2 = ', str1 + str2) # using * print('str1 * 3 =', str1 * 3)

Ko zaženemo zgornji program, dobimo naslednji izhod:

str1 + str2 = HelloWorld! str1 * 3 = PozdravljeniPozdravljeni

Skupno pisanje dveh nizovnih literal ju tudi poveže kot operator + .

Če želimo povezati nize v različne vrstice, lahko uporabimo oklepaje.

 >>> # two string literals together >>> 'Hello ''World!' 'Hello World!' >>> # using parentheses >>> s = ('Hello '… 'World') >>> s 'Hello World'

Ponavljanje skozi niz

Z zanko for lahko itiriramo skozi niz. Tu je primer za štetje števila 'l' v nizu.

 # Iterating through a string count = 0 for letter in 'Hello World': if(letter == 'l'): count += 1 print(count,'letters found')

Ko zaženemo zgornji program, dobimo naslednji izhod:

 Najdene 3 črke

Preizkus članstva v nizu

We can test if a substring exists within a string or not, using the keyword in.

 >>> 'a' in 'program' True >>> 'at' not in 'battle' False

Built-in functions to Work with Python

Various built-in functions that work with sequence work with strings as well.

Some of the commonly used ones are enumerate() and len(). The enumerate() function returns an enumerate object. It contains the index and value of all the items in the string as pairs. This can be useful for iteration.

Similarly, len() returns the length (number of characters) of the string.

 str = 'cold' # enumerate() list_enumerate = list(enumerate(str)) print('list(enumerate(str) = ', list_enumerate) #character count print('len(str) = ', len(str))

When we run the above program, we get the following output:

 list(enumerate(str) = ((0, 'c'), (1, 'o'), (2, 'l'), (3, 'd')) len(str) = 4

Python String Formatting

Escape Sequence

If we want to print a text like He said, "What's there?", we can neither use single quotes nor double quotes. This will result in a SyntaxError as the text itself contains both single and double quotes.

 >>> print("He said, "What's there?"")… SyntaxError: invalid syntax >>> print('He said, "What's there?"')… SyntaxError: invalid syntax

One way to get around this problem is to use triple quotes. Alternatively, we can use escape sequences.

An escape sequence starts with a backslash and is interpreted differently. If we use a single quote to represent a string, all the single quotes inside the string must be escaped. Similar is the case with double quotes. Here is how it can be done to represent the above text.

 # using triple quotes print('''He said, "What's there?"''') # escaping single quotes print('He said, "What\'s there?"') # escaping double quotes print("He said, "What's there? "")

When we run the above program, we get the following output:

 He said, "What's there?" He said, "What's there?" He said, "What's there?"

Here is a list of all the escape sequences supported by Python.

Escape Sequence Description
ewline Backslash and newline ignored
\ Backslash
\' Single quote
" Double quote
a ASCII Bell
 ASCII Backspace
f ASCII Formfeed
ASCII Linefeed
ASCII Carriage Return
ASCII Horizontal Tab
v ASCII Vertical Tab
ooo Character with octal value ooo
xHH Character with hexadecimal value HH

Here are some examples

 >>> print("C:\Python32\Lib") C:Python32Lib >>> print("This is printedin two lines") This is printed in two lines >>> print("This is x48x45x58 representation") This is HEX representation

Raw String to ignore escape sequence

Sometimes we may wish to ignore the escape sequences inside a string. To do this we can place r or R in front of the string. This will imply that it is a raw string and any escape sequence inside it will be ignored.

 >>> print("This is x61 good example") This is a good example >>> print(r"This is x61 good example") This is x61 good example

The format() Method for Formatting Strings

The format() method that is available with the string object is very versatile and powerful in formatting strings. Format strings contain curly braces () as placeholders or replacement fields which get replaced.

We can use positional arguments or keyword arguments to specify the order.

 # Python string format() method # default(implicit) order default_order = "(), () and ()".format('John','Bill','Sean') print('--- Default Order ---') print(default_order) # order using positional argument positional_order = "(1), (0) and (2)".format('John','Bill','Sean') print('--- Positional Order ---') print(positional_order) # order using keyword argument keyword_order = "(s), (b) and (j)".format(j='John',b='Bill',s='Sean') print('--- Keyword Order ---') print(keyword_order)

When we run the above program, we get the following output:

 --- Default Order --- John, Bill and Sean --- Positional Order --- Bill, John and Sean --- Keyword Order --- Sean, Bill and John

The format() method can have optional format specifications. They are separated from the field name using colon. For example, we can left-justify <, right-justify > or center ^ a string in the given space.

Cela števila lahko formatiramo tudi v binarne, šestnajstiške itd., Plavajoče pa lahko zaokrožimo ali prikažemo v eksponentni obliki. Obstaja veliko oblik oblikovanja, ki jih lahko uporabite. Obiščite tukaj za vse oblike niza, ki so na voljo z format()metodo.

 >>> # formatting integers >>> "Binary representation of (0) is (0:b)".format(12) 'Binary representation of 12 is 1100' >>> # formatting floats >>> "Exponent representation: (0:e)".format(1566.345) 'Exponent representation: 1.566345e+03' >>> # round off >>> "One third is: (0:.3f)".format(1/3) 'One third is: 0.333' >>> # string alignment >>> "|(:10)|".format('butter','bread','ham') '|butter | bread | ham|'

Oblikovanje starega sloga

Lahko celo formatiramo nize, kot je stari sprintf()slog, ki se uporablja v programskem jeziku C. Za to uporabimo %operaterja.

 >>> x = 12.3456789 >>> print('The value of x is %3.2f' %x) The value of x is 12.35 >>> print('The value of x is %3.4f' %x) The value of x is 12.3457

Pogoste metode nizov Python

Z objektom string so na voljo številne metode. format()Metoda, ki smo že omenili, je eden izmed njih. Nekateri izmed pogosto uporabljenih metod lower(), upper(), join(), split(), find(), replace()itd Pred vami je seznam vseh vgrajenih metod za delo z nizi v Python.

 >>> "PrOgRaMiZ".lower() 'programiz' >>> "PrOgRaMiZ".upper() 'PROGRAMIZ' >>> "This will split all words into a list".split() ('This', 'will', 'split', 'all', 'words', 'into', 'a', 'list') >>> ' '.join(('This', 'will', 'join', 'all', 'words', 'into', 'a', 'string')) 'This will join all words into a string' >>> 'Happy New Year'.find('ew') 7 >>> 'Happy New Year'.replace('Happy','Brilliant') 'Brilliant New Year'

Zanimive Članki...