Sign in to follow this  
Followers 0

Korpus engleskog jezika

6 posts in this topic

Imali smo već temu o tome koji su dobri onlajn rečnici engleskog jezika. Evo i teme posvećene drugoj potencijalno korisnoj alatki za sve koji se bave jezikom ili žele da usavrše svoje znanje.

In linguistics, a corpus (plural corpora) or text corpus is a large and structured set of texts (nowadays usually electronically stored and processed).

Korpus engleskog jezika je, dakle, kolekcija tekstova na engleskom. Kada u polje za pretraživanje unesete neku reč, dobijete gomilu rečenica (izvučenih iz knjiga, časopisa, novina itd) u kojima se ta reč pojavljuje. Tako možemo bolje da razumemo i upoznamo reč, da vidimo u kojim se sve kontekstima ona koristi i na koji način.

Mnogi korpusi su zatvoreni i nisu javno dostupni bez posebne dozvole, ali ima ih i koji su otvoreni za svakoga.

Korpus koji se oslanja na Google Books omogućava gomilu zanimljivih stvari, kao što je utvrđivanje frekventnosti reči po godinama itd: http://googlebooks.byu.edu/x.asp

This interface for Google Books allows you to search more than 200 billion words (200,000,000,000) of data in both the American and British English datasets, as well as the One Million Books and Fiction datasets. (If you're interested just in contemporary English, there are still nearly 100 billion words from just 1980-2009).

Dobar je i British National Corpus: http://www.natcorp.ox.ac.uk/

Na njega se naslanja ovaj, sa malo više user-friendly pretragom: http://phrasesinenglish.org/simplesearch.html

Ponekad koristim i ovaj: https://www.wordnik.com/

Eto, ako nekome zatreba. Poznato mi je da postoji i onlajn korpus srpskog jezika, valjda tek neki začetak, ali nije dostupan javno, nego samo onima koji imaju šifru. 

Share this post


Link to post
Share on other sites

Da se i ja nadovezem na temu korpusa. Imali smo jedan predmet na faksu Primene internet tehnologija u ucenju stranih jezika, profesorka nam je pokazivala gomilu ovakvih sajtova:

BNC je super za britanski engleski, dok je COCA http://corpus.byu.edu/coca/ specijalizovana za americki engleski. 

A tu je i http://www.lextutor.ca/, koji koristi oba korpusa i jos neke, ali je toliko saren i konfuzan da ne mogu da se setim kako se koristi 

Strasna stvar za kolokacije i pitanja tipa "da li se kaze 'famous of' ili 'famous for'" je ovaj sajt http://www.just-the-word.com/ i usput daje primere iz korpusa takodje. 

Ima stvarno super stvari, ja ga cesto koristim, bacite pogled. 

I da, http://www.lexipedia.com/ je kul takodje, poigrajte se. :)

Share this post


Link to post
Share on other sites

Jao, ovo sa jezičkim korpusima je tako bitna stvar koje većina prevodilaca nije ni svesna. Meni je internet najbrži, najdostupniji i najjednostavniji korpus. Jednostavno ukucam neku konstrukciju pod znacima navoda i vidim koliko ima pogodaka. Ako ima više od recimo milion, onda to prihvatim kao merodavno. Naravno, pogledam i kakvi su sajtovi, da li ih je pisao izvorni govornik i slično. 

Najsmešnije je, naravno, kad ukucam neku kombinaciju engleskih reči, a dobijem samo srpske sajtove.  ???

To naravno škartiram. 

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
Sign in to follow this  
Followers 0