Pesquisa no corpus
Para utilizar o sistema de busca, digite um texto ou um código no formato CQP (Corpus Query Protocol) na caixa de texto acima para pesquisar no corpus.
Os dados do projeto NURC Digital foram etiquetados com o parser PALAVRAS. Para maiores informações sobre o parser PALAVRAS e sobre as suas etiquetas, consulte o site do VISL. Os campos que podem ser pesquisados incluem:
word: a versão escrita da palavra
lemma: o lema
pos: a etiqueta Part-of-Speech (ou classe de palavra)
syn: a etiqueta sintática
morph: a etiqueta morfológica
extra: as etiquetas secundárias (informações semânticas, valência, informações secundárias de classe de palavra)
A página de pesquisa avançada inclui várias das opções de pesquisa específica do corpus.
A sintaxe CQP Query usa um sistema intuitivo de definição de propriedades das palavras que você procura, como por exemplo:
[lemma="bola"] [pos="PRP"]
Para a palavra bola seguida de uma preposição
[lemma="bola" & syn="SUBJ.*"]
Para a palavra bola com a função sintática de sujeito
Na consulta, é possível usar expressões regulares. Para encontrar palavras que tenham um ditongo "ue", por exemplo, você pode digitar:
[word="[^q]ue.*"]
Várias opções de busca avançada são possíveis. Para isso, deve consultar as etiquetas do parser PALAVRAS.
Os resultados apresentam o ítem de busca em destaque. Para ver as etiquetas associadas a cada íem lexical, basta localizar o mouse sobre a palavra. É possível ouvir cada trecho em que o ítem de busca foi encontrado, clicando no símbolo , no lado esquerdo do trecho.