Alpi Blog
Image default
Electronica en Computers

Wat is Python? Hoe kan ik tekst verwerken ermee?

Python is een vrij beschikbare, geïnterpreteerde taal van zeer hoog niveau, ontwikkeld door Guido van Rossum. Het combineert een duidelijke syntaxis met krachtige (maar optionele) objectgeoriënteerde semantiek. Python is wijdverbreid en zeer draagbaar.

Strings zijn onveranderlijke reeksen
Zoals bij de meeste programmeertalen op hoog niveau, zijn strings met variabele lengte het basistype in Python. Python wijst een geheugengebied toe om strings (of andere waarden) achter de schermen op te slaan, waar de programmeur er niet al te veel over hoeft na te denken. Bovendien heeft Python verschillende mogelijkheden voor het manipuleren van tekenreeksen die niet in andere talen op hoog niveau voorkomen.

In Python zijn strings “onveranderlijke reeksen”. Het programma kan verwijzen naar elementen of subreeksen van strings als naar willekeurige reeksen, ook al kunnen strings, zoals tuples, niet direct “ter plaatse” worden gewijzigd. Python benadert subreeksen met behulp van een flexibele plakbewerking, die is opgemaakt zoals het specificeren van een reeks rijen en kolommen in een spreadsheet. De volgende interactieve sessie illustreert het gebruik van strings en segmenten.

Bestanden en stringvariabelen
Met tekstverwerking bedoelen we meestal het verwerken van de inhoud van een bestand. In Python is het gemakkelijk om de inhoud van een tekstbestand in stringvariabelen te lezen, waar deze inhoud kan worden gemanipuleerd. Bestandsobjecten bieden drie leesmethoden: .read (), .readline () en .readlines (). Elk van deze methoden kan een argument hebben om de hoeveelheid gegevens die tegelijkertijd wordt gelezen te beperken, maar ze worden meestal zonder argument gebruikt. .read () leest een volledig bestand in één keer en wordt meestal gebruikt om de inhoud van een bestand in een stringvariabele te plaatsen. Hoewel .read () de meest directe stringvoorstelling geeft van de inhoud van een bestand, is het onhandig voor opeenvolgende lijngeoriënteerde verwerking van een bestand, en het is niet mogelijk als het bestand groter is dan het beschikbare geheugen.

Geavanceerde text verwerking met Spacy Hybride python lib

Spacy python

https://www.webdeveloper.today/2020/12/tekstverwerking-python-text-processing.html