Cómo buscar Ngram de manera más efectiva con Google Ngram Viewer

Google mantiene una base de datos multilingüe del idioma publicado. Al escanear libros en masa, Google es capaz de procesar el texto y proporciona la frecuencia de aparición de palabras basada en datos estadísticos. Con el Herramienta de búsqueda Google Ngram Viewer, puede buscar entre esos voluminosos datos estadísticos de forma rápida y eficaz. Al comparar la popularidad relativa de las palabras, puede mapear cómo el idioma y la cultura han cambiado con el tiempo. Sin embargo, Ngram puede hacer mucho más que simplemente informar la frecuencia de las palabras dentro del vasto corpus textual de Google.

Búsquedas básicas (1 gramo)

1. Escriba su palabra clave en el Cuadro de búsqueda de ngram.

google-ngram-viewer-search-tips-tricks-1-gram

2. Si desea buscar todas las mayúsculas de una palabra, marque la casilla “no distingue entre mayúsculas y minúsculas”. En esta búsqueda, devolvería tanto “pizza” como “Pizza” en los resultados.

google-ngram-viewer-search-tips-tricks-case

3. Configure los parámetros de búsqueda debajo del cuadro de búsqueda. Esto incluye el rango de fechas y el corpus de idioma.

google-ngram-viewer-search-tips-tricks-parameters

La fecha simplemente establece los límites del eje Y de su gráfico. Dependiendo del corpus que seleccione, las fechas máximas y mínimas variarán ampliamente.

El valor de suavizado elimina los picos y caídas atípicas de sus datos. Los valores de suavizado más bajos son más precisos, mientras que los valores más altos solo revelan tendencias más profundas.

Seleccionar un corpus

google-ngram-viewer-search-tips-tricks-corpuses

El corpus es la colección de texto que examinará Ngram Viewer. El valor predeterminado de “inglés” es aceptable para la navegación informal, pero puede ser muy académico.

La “ficción inglesa” reflejará más de cerca el lenguaje común. El corpus estándar en “inglés” puede ser de no ficción, con muchas palabras técnicas. Google ofrece breves explicaciones de lo que contiene cada corpus.

Búsqueda avanzada (de 2 a 5 gramos)

Al agregar palabras de búsqueda adicionales (“gramos”, en el idioma del motor de búsqueda), puede crear comparaciones complejas a lo largo del tiempo. Puede mejorar la búsqueda con comandos de palabras clave como la funcionalidad avanzada de Búsqueda de Google.

Separe los términos de búsqueda secuenciales con una coma.

google-ngram-viewer-search-tips-tricks-3-gram

Ngram Viewer mostrará la frecuencia relativa de sus términos de búsqueda en un solo gráfico. Desplácese sobre las líneas del gráfico para ver puntos de datos precisos.

google-ngram-viewer-search-tips-tricks-mouseover

Búsqueda con comodines

Utilice el asterisco (“*”) en sus términos de búsqueda como comodín. Por ejemplo, “Bachelor of *” arrojaría resultados para muchos títulos de licenciatura.

google-ngram-viewer-search-tips-tricks-wildcard

Búsqueda de inflexión

Para encontrar todas las inflexiones de un término, agregue el comando de texto “_INF”. Esto busca cada inflexión de la palabra adjunta, como las diversas formas de “to be” en inglés.

google-ngram-viewer-search-tips-tricks-inflexiones

Partes de la oración

Si una palabra incluye muchas partes del habla, puede agregar operadores de texto para que sean específicos. Las partes válidas del discurso en la base de datos de Google incluyen todas las siguientes:

  • _ADJ_: adjetivo (rápido, grande, inteligente)
  • _ADV_: adverbio (rápido, más tarde, siempre)
  • _PRON_: pronombre (su, eso, nosotros)
  • _DET_: determinante o artículo (a, an, the)
  • _ADP_: adposition (preposiciones y posposiciones)
  • _NUM_: numeral (primero, segundo, quinto)
  • _CONJ_: conjunción (y, ni, pero)
  • _PRT_: partícula, que es una categoría general y rara vez utilizada para otras funciones de palabras

Cada uno de estos gramos se puede combinar en frases. Por ejemplo, “_ADJ_ niño” devolvería pares de palabras adjetivo + “niño”.

Para especificar una parte específica del discurso para un término de búsqueda, añádalo al final: es decir, “water_VERB”, sin un guión bajo al final.

Para incluir todas las partes del discurso de una palabra determinada, utilice el operador comodín después del guión bajo, como se muestra a continuación.

google-ngram-viewer-search-tips-tricks-part-of-speech-wildcard

Usar variables funcionales

Las variables funcionales le permiten buscar por función o ubicación de palabras.

  • _RAÍZ_ es un marcador de posición para la raíz del árbol de análisis sintáctico de la oración. Este suele ser el sujeto principal o la palabra modificada por el verbo.
  • _COMIENZO_ indica el comienzo de una oración (“_START_ President Obama” devuelve solo oraciones que comienzo con la frase “presidente Obama”).
  • _FIN_ indica el final de una oración (“_ADP_ _END_” devuelve oraciones que fin en preposiciones).

Composiciones

Al combinar términos de búsqueda con operadores aritméticos, puede realizar un análisis matemático simple con valores para la frecuencia de los términos:

  • + agrega múltiples expresiones en un término de búsqueda
  • resta la expresión de la derecha de la expresión de la izquierda, lo que proporciona una forma rápida de comparar el uso relativo de dos términos de búsqueda.
  • / divide la expresión de la izquierda por la expresión de la derecha
  • * multiplica la expresión para comparar ngramas de frecuencia muy variada. Asegúrese de encerrar todo el ngram entre paréntesis para evitar que el asterisco se analice como un carácter comodín.
  • : busca el ngrama de la izquierda dentro del corpus de la derecha

Dependencias

google-ngram-viewer-search-tips-tricks-dependencies

Finalmente, puede establecer dependencias con “=>” para buscar relaciones lingüísticas. “Car => fast” devolvería resultados donde “rápido” dependía gramaticalmente de la palabra “car” o la modificaba. Esto se puede combinar libremente con cualquiera de las operaciones de búsqueda avanzada.

Conclusión

Al trabajar con varios gramos, su búsqueda puede complicarse rápidamente. Algunas de estas técnicas de búsqueda funcionan bien juntas, mientras que otras son incompatibles. La mejor manera de saber si algo funciona es simplemente intentarlo. Por ejemplo, la etiqueta _INF es muy flexible, mientras que _VERB es exigente. Aprenderá rápidamente las peculiaridades a medida que profundiza en el kit de herramientas de Ngram Viewer.

Crédito del icono: Good Ware

¿Es útil este artículo?

¡Compártelo en redes!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *