Tag Archives: Bases de datos

IRESIE: una base de datos sobre investigación educativa latinoamericana

28 Jun

IRESIE es una base de datos de la Universidad Nacional Autónoma de México. Las siglas significan Índice de Revistas de Educación Superior e Investigación Educativa y sus orígenes datan de 1997.

IRESIE permite buscar la referencia a artículos publicados en las mas de 1300 revistas que indexa (aquí se puede ver una lista con todas las revistas). Por ejemplo, la expresión «comprensión lectora» proporciona, cuando estoy escribiendo esta entrada, 966 referencias. De esas referencias se enlaza con el texto completo de 471.

La herramienta de búsqueda permite realizar búsquedas avanzadas (multicampo, con palabras incompletas o con operadores).

 

Anuncio publicitario

Una base de datos de tratamientos para dificultades de lenguaje

14 Ago

Presento la base de datos What Works. Esta base de datos es la versión online de un informe sobre intervenciones para niños con problemas de habla y lenguaje titulado «What Works»: Interventions for children and young people with speech, language and communication needs. El informe es uno de los resultados de un programa de investigación sobre la atención a niños con dificultades de habla, lenguaje y comunicación, encargado por el gobierno del Reino Unido.

Antes de seguir, dos cuestiones prácticas: la primera es que no se debe confundir la base de datos What Works con What Works Clearinghouse, que pertenece al departamento de educación de Estados Unidos y trata temas generales de educación. La segunda es que para acceder a What Works es necesario suscribirse. Quien esté intersado pero no quiera hacerlo puede encontrar la misma información (creo) en el informe que he citado en el párrafo anterior.

La base de datos

La base de datos contiene información sobre intervenciones para niños con problemas de habla, lenguaje y comunicación. Es posible encontrar información sobre intervenciones para mejorar el vocabulario, la competencia gramatical y la comprensión en general, pero, también es cierto, que la mayor parte de la información tiene que ver con la intervención en problemas de habla y comunicación.

Logotipo de la institución que mantiene la base de datos

What Works tiene un buscador en el que se pueden localizar intervenciones según cinco criterios: tipo de problema (de habla, de lenguaje, de comunicación, complejo), edad de los alumnos, foco de la intervención, aplicador (logopeda, profesor, asistente, otros), y formato (manual, enfoque, técnica).

De cada intervención se presenta una descripción, una indicación sobre quién la realiza (logopedas, profesores, padres, asistentes,…), un resumen de las evidencias que sustentan su eficacia, un contacto con autores, distribuidores o grupos relacionados con el tratamiento, y una bibliografía acerca de él. Existe también una sección sobre su puesta en práctica donde las personas que lo utilizan pueden exponer su experiencia, pero en ninguna de las consultas que he hecho a la base de datos he encontrado ningún tratamiento que incluyera alguna de esas experiencias.

Valoración personal

Llevaba un tiempo buscando información sobre intervenciones para mejorar la comprensión oral cuando me encontré con la base de datos What Works. Me causó muy buena impresión que todas las intervenciones que había localizado (y algunas más) apareciesen en la base de datos. Sí que tengo ciertos recelos acerca de los criterios con los que establecen el nivel de evidencia de una intervención (indicativo, moderado o sólido), ya que no he visto qué criterios siguen para hacer la valoración.

Frecuencia de las palabras en el español

29 Abr

Estoy preparando una investigación sobre lectura y necesito comprobar que dos textos son similares, algo más complicado de lo que parece porque dos textos pueden ser similares o diferentes en muchas cosas: tema, número de palabras, número de oraciones, complejidad de las sílabas que aparecen… Una de las medidas que quiero tener en cuenta es si las palabras que contienen los textos son muy frecuentes o poco frecuentes en el español.

En otras ocasiones he utilizado para comprobar la frecuencia con que aparece una palabra el diccionario de frecuencias de Alameda y Cuetos (1995). Pero esta vez estoy utilizando otra herramienta muy interesante: las medidas de frecuencia del corpus del español de la Real Academia Española, que pone a nuestra disposición un listado con las frecuencias con que aparecen las palabras del Corpus de Referencia del Español Actual (CREA). Podemos acceder a las 1.000 palabras más frecuentes, a las 5.000 más frecuentes, a las 10.000 más frecuentes o a todo el corpus, que tiene más de 70.000 palabras. Con la herramienta de búsqueda que tenga el programa con el que estemos viendo el documento se puede buscar la palabra que nos interese.

Para quien tenga un interés especial en el estudio del léxico es recomendable que miren base de datos completa, el CREA que permite operaciones bastante más complejas que consultar la frecuencia con que aparece una palabra.

Interfaz de consulta del corpus CREA

En bachillerato tuve un profesor de latín que nos hizo aprender la máxima “ex abundantia cordis os loquitur” (o algo parecido) que se traduce como “la boca habla de lo que abunda en el corazón”. Por eso siempre que me encuentro una herramienta de este tipo me gusta comprobar cuáles son las palabras más frecuentes pensando que eso es lo que abunda en nuestro corazón. Evidentemente buena parte de las palabras más frecuentes tienen función gramatical más que significado. En los 10 primeros puestos encontramos “de, la, que, el, en, y, a, los, se, del”. Pero las que me interesan son otras. Por ejemplo, en el puesto 47 encontramos “años” que me parece la primera palabra con contenido semántico. En el puesto 64 está “parte” y en el 70 “tiempo”. En el 76 encontramos “vida”, en el 86 “gobierno”, en el 90 “día”, y en el 98 “país”. Ya a partir de la 100 hay palabras como “mundo (101)”, “año (102)”, “presidente (115)”, “casa (122)”, “España (134)”, “Madrid (140)”, “nacional (141)”, “trabajo (142)”, “política (152)”, “poder (166)”, “partido (171)”, “personas (172)”, “grupo (173)”, “mujer (181), “José (183)”,…

¿Solo nos interesa el fútbol? Si nos saltamos “partido” que puede relacionarse con el deporte y con la política, “fútbol” aparece en el puesto 839, y palabras como “deporte”, “balón”, “portería” o “gol” no aparecen entre las 1.000 más frecuentes del corpus.

La enciclopedia de las mejores prácticas

25 Nov

El logotipo de la enciclopedia de las mejores prácticas es una abeja lectora. ¿Por qué? porque las iniciales de Best Evidence Encyclopaedia forman la palabra BEE, abeja, en inglés, y la enciclopedia está hecha por el Instituto para la Educación Eficaz, de la Universidad de York.

Esta enciclopedia es, en realidad, una web donde se ofrece información acerca de la eficacia de programas educativos para la mejora de la lectura, de las matemáticas y de la educación infantil.

En el caso que nos interesa, que es el de la lectura, se ofrecen los siguientes apartados:

  • Inicios de la lectura.
  • Lectores con dificultades.
  • Lectura en primaria.
  • Lectura en secundaria.
  • Lectura del inglés como idioma adicional.
  • TICs para la lectura.

En cada una de estas secciones se ofrece un informe en PDF, o se puede consultar la información a través de enlaces en los que se puede ver un resumen de la revisión realizada, o información sobre los métodos analizados, dividida en tres categorías: métodos mejor calificados, métodos con evidencias limitadas, y otros métodos.

En los métodos mejor calificados se distingue entre los que muestran evidencias fuertes de eficacia y los que muestran evidencias moderadas. En los métodos con evidencias limitadas se distingue entre los que están respaldados por evidencias consistentes pero muestran un efecto pequeño, y los que muestran un efecto grande pero están respaldados por evidencias débiles. Los que se describen en el apartado de otros métodos también se dividen en dos tipos, los que no alcanzaban un nivel mínimo de evidencia y los que no cumplían los requisitos para ser revisados.

Para hacerse una idea del trabajo realizado, en la sección de lectura en primaria se revisan 17 programas en las secciones de métodos mejor calificados y métodos con evidencias limitadas. En la sección de otros métodos se ofrece la referencia a 201 un programas (más de 100 no se analizan por no estar en uso en el Reino Unido).

La información que se da es muy breve, de modo que se incluyen pocos datos técnicos o estadísticos, pero tampoco se profundiza en la descripción de los programas. La ventaja es que la enciclopedia de las mejores prácticas es mucho más sencilla de leer que, por ejemplo, What Works Clearinghouse. El inconveniente es que si uno quiere saber más sobre los métodos valorados tiene que buscar información en otros sitios.

¿Se imaginan que se pudiera disponer de una base de datos donde se revisasen más de 200 intervenciones para la mejora de la lectura en español y se distinguiese a las más eficaces? Un compañero mío dice que eso es imposible porque ni siquiera hay 200 intervenciones que revisar. Yo creo que sí las hay, contando como intervenciones las propuestas de lectura que realizan o han realizado las distintas editoriales de textos escolares. Otra cuestión es que la mayoría de ellas sería calificadas como «otras intervenciones» porque no hay ningún estudio acerca de su eficacia.

Un ejemplo a seguir: What Works Clearinghouse / Doing What Works

9 Jul

«Si esto se hace con la investigación sobre educación en español, cierro el blog y me dedico a otra cosa». Esto es lo que me viene a la cabeza cada vez que entro en la web de What Works Clearinghouse (WWC), una iniciativa del Departamento de Educación de Estados Unidos donde se dedican a revisar, evaluar y sintetizar la investigación sobre métodos de intervención en educación, y a elaborar guías prácticas para educadores acerca de las intervenciones que han mostrado su eficacia.

Una de las seis grandes áreas que se están trabajando es la de lectura y escritura, y dentro de ella se distingue una parte de comprensión lectora. Cuando se utiliza el buscador de intervenciones para localizar aquellas que muestran evidencias de eficacia aparecen, del día que escribo esta entrada, 15 referencias a métodos de mejora de la comprensión lectora. La información se organiza en una tabla donde se nombra la intervención, el nivel en el que se ha empleado, el índice de mejora que ha producido, una valoración de su efectividad y otra valoración del nivel de evidencias que ofrece. Pinchando en el nombre del programa se ofrece una información más detallada.

Guía de WWC

WWC también edita guías para educadores que ofrecen recomendaciones prácticas basadas en evidencias. En 2010 se publicó una sobre la mejora de la comprensión lectora desde educación infantil hasta el tercer curso de primaria.

 Información complementaria

· Vídeo guía sobre WWC (en inglés)

· Improving Reading Comprehension in Kindergarten Through 3rd Grade.

Rastreo de referencias en Google Académico

21 Jun

Continúo con mi revisión sistemática sobre métodos para la mejora de la comprensión lectora en español. Anteriormente he realizado una búsqueda de trabajos de investigación en bases de datos con la que he localizado 167 referencias potencialmente interesantes. Lo siguiente que he utilizado es un rastreo. Para ello he utilizado Google Académico, también conocido como Google  Scholar. 

Esta base de datos permite hacer rastreo de referencias: si conoces un trabajo relevante en un campo y lo introduces en el buscador podrás encontrar publicaciones que hayan citado al anterior. De esta forma pueden aparecer referencias que no se hayan encontrado en las bases de datos, porque no se han incluido en esas bases de datos o porque la estrategia de búsqueda no permitía recuperarlas.

El inconveniente de este modo de buscar de información es que no se puede empezar de cero:  ya tienes que conocer alguna publicación para localizar otras que la hayan incluido en su bibliografía. Otro problema es que las publicaciones más recientes prácticamente no producen resultados, ya que no ha habido tiempo para que otros autores puedan citarlas.

 El funcionamiento es sencillo. Se introduce en el cuadro de búsqueda el título de la publicación fuente, y, al estilo Google, aparece un listado de información relacionada. Se busca en el listado el trabajo fuente, y en la parte inferior izquierda de la entrada aparecerá el texto Citado por / Cited by y un número (el de publicaciones que citan a la fuente). Pinchando en ese enlace se accede al listado de publicaciones que citan el trabajo que habíamos introducido en el buscador.

Si un campo de investigación está muy cohesionado basta con incluir una referencia clave por su importancia y, probablemente, todo lo que se haya publicado posteriormente la citará. Si el campo de investigación está disperso no será posible encontrar una referencia clave. Esto es lo que ha sucedido con la investigación sobre métodos de mejora de la comprensión lectora en español. En las bases de datos se habían encontrado (aproximadamente) 167 referencias. Realicé el rastreo con 138 de esas referencias, las publicadas en tre 1950 (en realidad sólo había dos anteriores a 1985) y 2004. En Google Académico se encontraron citas a solo 56 de esas 138 referencias. Si se consideran las citas relevantes, es decir las de otros trabajos de investigación sobre la mejora de la comprensión lectora en español, con grupo experimental y grupo de control, solo 23 de las referencias introducidas recibieron citas relevantes. Eso indica que, según Google Académico, la mayoría de la investigación científica sobre la mejora de la comprensión lectora en español ha recibido poca atención, incluso por parte de personas que investigaban en el mismo campo.

El resultado de todo esto es que con este procedimiento he localizado 7 referencias que no había encontrado en las bases de datos.

Ahora el Guinnes de los records:

La publicación más citada, con 42 citas, ha sido Estructuras textuales y procesos de comprensión: un programa para instruir en la comprensión de textos, de Emilio Sánchez (1990).

La publicación con más citas relevantes, con 4 citas relevantes, ha sido Un programa para la enseñanza de la comprensión de ideas principales de textos expositivos, de Eduardo Vidal-Abarca (1990).

La publicación sobre métodos de mejora de la comprensión lectora en español más documentada (la que más cita a otras investigaciones del mismo campo) es la tesis doctoral La comprensión de los textos expositivos: influencia de su estructura, del desarrollo cognitivo y de la instrucción, de Matilde Neira (2005), que cita 10 de las 138 referencias buscadas.

 

 

Algunos comentarios sobre la búsqueda en bases de datos

10 May

Bases en las que se encontraron más referencias

La revisión sistemática es un método muy adecuado para conocer el estado de la cuestión en un campo de la ciencia. Como se vio en la entrada anterior, buscando en distintas bases de datos, he encontrado 167 referencias que posiblemente conducen a investigaciones sobre métodos para mejora de la comprensión estudiados en alumnos hispano-hablantes. Probablemente no todas sean lo que he creído que podían ser, y estoy seguro de que existen otros trabajos sobre el tema que no han sido localizados en esta búsqueda (por eso utilizaré otras fuentes alternativas), pero se indica que hay un cuerpo de investigaciones notable, que permitirá utilizar técnicas de metanálisis para sintetizar los resultados que se han obtenido en ellas. Además del dato que se ofrecía en la entrada anterior, de cuántas referencias se han encontrado en cada base de datos, he calculado qué exclusividad tienen las que permitieron localizar más referencias. En el gráfico se puede ver, en color azul, el número de referencias que sólo se han encontrado en esa base de datos, en naranja las que se encuentran también en alguna de las otras dos que se comparan, y en amarillo las que se encuentran en otras bases de datos que no se han incluido en el gráfico (y no se encuentran en las otras dos que se comparan). Así se puede ver, que aunque se han encontrado más referencias en Redined que en Mastesis, buena parte de las que están en Redined también se encuentran en Dialnet, mientras que solo una de las referencias que se encuentran en Mastesis se encuentra en Dialnet o Redined. Si solo se pudiesen elegir dos bases de datos para hacer la búsqueda encontraríamos más referencias con Dialnet y Mastesis que con Dialnet y Redined. De las 167 referencias encontradas, el 29% solo aparecía en Dialnet, el 5% solo aparecía en Redined, y el 11% solo aparecía en Mastesis, de modo que entre las tres se puede tener noticia del 45% de las referencias localizadas. O, desde otras perspectiva, si solo consultásemos las tres bases de datos que más resultados ofrecen no accederíamos, al menos, al 55% de la información relevante. Algo muy peculiar de los resultados de esta búsqueda es que tanto Dialnet como Redined y Mastesis son de acceso libre. La  base de datos «de pago» que más resultados produjo fue PsycINFO, donde se localizaron 16 referencias (tres de esas 16 se habían encontrado en Dialnet). Hay que tener en cuenta que las bases de datos «de pago» consultadas son internacionales y son bastante rigurosas seleccionando las publicaciones que incluyen. Por último señalar que Dialnet no es la base de datos más extensa. Teóricamente en google se puede encontrar lo mismo que en Dialnet y muchas cosas más. Lo que sucede es que las dos búsquedas en Google se limitaron a los 50 primeros resultados. A mayor cantidad de información más difícil resulta encontrar la que buscas.

Acabada la búsqueda en bases de datos

7 May

Un tema recurrente en este blog es la revisión sistemática de la investigación sobre métodos de mejora de la comprensión lectora en español, trabajo que voy realizando poco a poco. Hoy mismo he acabado de incluir en la herramienta de gestión de referencias Refworks toda la información que he encontrado al respecto en bases de datos. A continuación incluyo una lista de las bases de datos consultadas y el número de referencias potencialmente útiles que he encontrado en cada una. He señalado con un asterisco las bases de datos de acceso libre por si alguien quiere realizar sus propias búsquedas.

· Dialnet*: 69 referencias encontradas.
· Redined* (bases de datos de educación): 23 referencias.
· Mastesis* (buscador de tesis doctorales): 22 referencias.
· PsycINFO (base de datos de la American Psychological Association): 16 referencias.
· Google*: 14 referencias.
· Cátedra Unesco para lectura y la escritura*: 9 referencias.
· Teseo (base de datos de tesis doctorales)*: 9 referencias.
· Educ@ment* (de la Universidad Rovira i Virgili): 5 referencias.
· Biblioteca de la Universidad de Navarra:* 4 referencias.
· Conycit (repositorio de la Comisión Nacional de Investigación Científica y Tecnológica de Chile):* 3 referencias.
· Proquest – Dissertations & theses: 3 referencias.
· ISI web of knowledge: 3 referencias.
· Proquest – Periodicals Index Online: 2 referencias.
· ScIELO*: 2 referencias.
· SAGE: 1 referencia.
· E-Libro: 1 referencia.
· Cogprints*: 1 referencia.
· EBSCO: 0 referencias.
Algunas de las anteriores han sido encontrados en más de una base de datos, de modo que, en total, se han localizado 167 referencias a trabajos que (supuestamente) estudian la eficacia de algún método de mejora de la comprensión lectora de forma experimental o cuasi-experimental en estudiantes de hasta 18 años de edad. Más adelante será necesario revisar los trabajos completos y comprobar que cumplen los requisitos para ser incluidos en el metanálisis que se realizará con ellos.

La base de datos Dialnet

3 Dic

Dialnet es una base de datos de la Universidad de la Rioja especializada la producción humanística iberoamericana. Aunque no tiene el desarrollo de grandes bases de datos como ERIC, o PsycINFO, es uno de los mejores recursos para buscar evidencias sobre la lectura en español.

Presentación

Utilizando como término de búsqueda «comprensión lectora» he obtenido 555 resultados, de los que 92 podrían ser estudios experimentales sobre la comprensión lectora (a veces la única información para intuir el contenido es el título).  Dialnet ofrece el texto completo de 15 de esas 92 publicaciones.

La base de datos ERIC

12 Nov

ERIC son las siglas de Education Ressources Information Center, que se anuncia como la mayor biblioteca digital sobre educación. Esta base de datos está patrocinada por el departamento de educación de los Estados Unidos, y su acceso es gratuito.

Logotipo de Eric

En el verano de 2009 quería realizar una búsqueda sistemática de publicaciones sobre comprensión lectora, y otros investigadores me comentaron que, evidentemente, lo mejor es buscar en varias bases de datos, pero si tenía que elegir una sola, que no fuese ERIC.

Me lo tomé con calma y acudí al catálogo de publicaciones periódicas de la red de bibliotecas universitarias (Rebiun), que permite consultar los fondos (físicos y electrónicos) de 74 bibliotecas universitarias y de investigación españolas. Allí hice una consulta sobre las publicaciones periódicas editadas entre 1990 y 2009 sobre educación, lectura, lingüística aplicada, pedagogía y psicología.

De este conjunto de publicaciones seleccioné las que estaban revisadas por pares, y descarté las que trataban sobre poblaciones concretas (personas con deficiencia visual, con deficiencia auditiva, con altas capacidades, grupos étnicos concretos, tercera edad,…) excepto las que trataban de personas con dificultades de aprendizaje o acerca de la infancia.

Tras aplicar estos criterios había seleccionado 360 publicaciones de materias relacionadas con la lectura, utilizadas por los investigadores españoles. La mayor parte de ellas estaba escrita en lengua inglesa. Una buena parte utilizaba el castellano, y algunas publicaciones utilizaban otras lenguas: portugués, francés, gallego, catalán y otros.

Ordené las publicaciones de forma alfabética y seleccioné la tercera parte de la lista (los múltiplos de tres en el orden alfabético) para comprobar si estaban incluidos en las bases de datos ERIC, PsycINFO y Current Contents.

La exclusividad de una base de datos se calculaba según el número de publicaciones que sólo estaban indexadas en ella, y el solapamiento, según el número de publicaciones que se encontraban en dos bases de datos o en las tres.

Los resultados son los siguientes:

· Exclusividad de PsycINFO: 1%
· Exclusividad de Current Contents: 13%
· Exclusividad de ERIC: 22%

· Solapamiento entre PsycINFO, Current Contents y ERIC: 5%
· Solapamiento entre PsycINFO y Current Contents: 6%
· Solapamiento entre PsycINFO y ERIC: 4%
· Solapamiento entre Current Contents y ERIC: 17%

· No aparición: 33%

El porcentaje de no aparición (33%) indica que las bases de datos PsycINFO, Current Contents y ERIC no contienen información sobre la tercera parte de publicaciones seleccionadas (las que podrían tratar la lectura) entre aquellas manejadas en las universidades y centros de investigación españoles. Inspeccionando los datos se comprobó que las publicaciones en lenguas distintas del inglés no estaban incluidas en las bases de datos. Estas publicaciones constituían un 23% del corpus, y el idioma utilizado era el castellano, exceptuando una en francés. Si se cuentan sólo las publicaciones en inglés, un 13% no estaba incluido en las bases de datos.

Esta exploración tiene muchas limitaciones, pero indica que las tres bases de datos analizadas ignoran en gran medida las publicaciones en lengua española que podrían dar información sobre la lectura y cubren el 87% de las publicaciones en lengua inglesa que  se emplean en las universidades españolas.

Respecto a la base de datos ERIC, su porcentaje de exclusividad es el más alto, de modo que una estrategia de búsqueda eficiente comenzaría por ella, aunque sería recomendable usar también, como mínimo, Current Contents. Si el objeto de la revisión es la comprensión lectora en lengua española, no sería recomendable utilizar como única fuente de información estas bases de datos.

Debido al escaso índice de exclusividad de PsycINFO una estrategia de búsqueda eficiente debería comenzar por la base de datos ERIC y continuar con el uso de Current Contents, con un porcentaje de exclusividad del 13%.