ac_clean_stopwords() retorna (e opcionalmente modifica) o vetor de
stopwords adicionais que o pesquisador pode passar a ac_clean() via
extra_stopwords. Funciona como um ponto de partida editável: o
pesquisador inspeciona o vetor, adiciona ou remove termos conforme o
corpus, e passa o resultado para extra_stopwords.
Usage
ac_clean_stopwords(
add = NULL,
remove = NULL,
preset = c("empty", "pt", "pt-br-extended", "pt-legislativo")
)Examples
# Ver o vetor padrão vazio e adicionar termos
sw <- ac_clean_stopwords(add = c("nobre", "ilustre", "respeitavel"))
print(sw)
#> [1] "nobre" "ilustre" "respeitavel"
# Partir do preset legislativo e remover termos que interessam ao corpus
sw <- ac_clean_stopwords(
preset = "pt-legislativo",
remove = c("lei", "projeto") # manter: são relevantes para a análise
)
# Usar na limpeza
# ac_clean(corpus, remove_stopwords = "pt", extra_stopwords = sw)
