Zoom Logo

Indexación de Google Scholar para Repositorios DSpace en Ecuador - Shared screen with speaker view
Michele Mennielli
15:17
Josefina, I think we can start
Monica Westin
15:37
back!
Michele Mennielli
15:49
There’s a weird sound
Michele Mennielli
15:56
but I think we can start
Michele Mennielli
15:59
Josefina?
Monica Westin
17:32
It is possible to mute all attendees for the moment?
Michele Mennielli
17:35
Can you all see the slide?
Michele Mennielli
17:49
Attendees are muted by default. They can’t speak
Monica Westin
17:54
weird
Michele Mennielli
18:13
perfect, thanks
Pablo Crespo
18:15
yes, we can see the slides
Pablo Crespo
22:23
La traducción se realiza en la sección de la presentación de Monica Westin
Pablo Crespo
22:56
can give us one minute please
Pablo Crespo
26:05
¡Gracias por estar con nosotros! Mi nombre es Mónica Westin y trabajo en Google Académico, en el área de alianzas y difusión. Me complace mucho hablarles a todos ustedes hoy sobre cómo garantizar que su repositorio esté bien indexado en Google Académico. Habrá una buena cantidad de tiempo para preguntas al final. Esperaré un momento para que todos se aseguren de que estén en silencio ... De acuerdo, comencemos.
Pablo Crespo
26:49
La parte informativa de este seminario web durará alrededor de 30 minutos. Comenzaré con una descripción general de cómo funciona el sistema de indexación de Google Académico y lo que se necesita para ser incluidos. A partir de ahí, describiré los problemas comunes de indexación del repositorio y cómo identificarlos y solucionarlos. Les mostraré cómo verificar la cobertura de su repositorio en Google Académico. Finalmente, terminaré con información sobre dónde pueden encontrar más recursos sobre Google Académico y pautas para la solución de problemas. La segunda parte de la charla se dedicará a una sesión de preguntas y respuestas con todos ustedes.
Pablo Crespo
27:20
El sistema de indexación de Google Académico funciona mediante la búsqueda de contenido académico, la identificación de metadatos asociados y la agrupación de diferentes versiones de elementos en los resultados de búsqueda. Para hacer esto, primero, un rastreador explora la web en busca de artículos académicos. Una vez que se ha identificado un elemento, el sistema busca y analiza los metadatos bibliográficos para este elemento. El sistema enumera todas las versiones del elemento en los resultados de búsqueda, como se puede ver en el enlace "Las 4 versiones" que he resaltado aquí.
Pablo Crespo
28:18
Investigadores de todo el mundo utilizan Google Académico de manera muy amplia, y la inclusión de la colección de su repositorio en los resultados de búsqueda de Google Académico crea una visibilidad global inmediata para estas publicaciones. Sabemos lo importante que puede ser este beneficio para los autores de su institución. También muestra el importante papel de la biblioteca en la difusión de las investigaciones de su institución.Investigadores de todo el mundo utilizan Google Académico de manera muy amplia, y la inclusión de la colección de su repositorio en los resultados de búsqueda de Google Académico crea una visibilidad global inmediata para estas publicaciones. Sabemos lo importante que puede ser este beneficio para los autores de su institución. También muestra el importante papel de la biblioteca en la difusión de las investigaciones de su institución.
Pablo Crespo
28:28
La imagen aquí muestra un resultado de búsqueda típico de Google Académico para un elemento que es exclusivo de un repositorio. Tanto el enlace principal para este elemento como lo que llamamos el "enlace de acceso" a la derecha, que va directamente al PDF, apuntan a esta publicación en el repositorio DSpace.
Pablo Crespo
28:37
Cuando la versión publicada formalmente de un artículo está disponible en el sitio de un editor, esa versión generalmente aparecerá como el enlace principal. La versión del repositorio aún puede aparecer como enlace de acceso, especialmente si no hay una versión de acceso abierto en el sitio del editor, como se ve aquí: el enlace de la Cambridge University Press es el enlace principal, y el enlace del repositorio es el enlace de acceso. Si el repositorio está correctamente indexado, la versión del repositorio estará en el enlace "Las # versiones" que mencioné anteriormente. En la siguiente diapositiva, les mostraré cómo se ve la página "Las 4 versiones" para este artículo.
Pablo Crespo
29:08
Esta es la página que aparece cuando hago clic en "Las 4 versiones". Aquí pueden ver que el primer resultado es la versión del editor, y la versión del repositorio aparece en segundo lugar. Google Académico también indexa citas y registros de agregadores.
Pablo Crespo
29:32
Entonces, ¿qué necesita el sistema de indexación de Scholar para encontrar los elementos de su repositorio e incluirlos en los resultados de búsqueda como acabo de mostrar? Describí anteriormente cómo comienza rastreando la web. Eso significa que necesita acceso para rastrear el sitio de su repositorio para que se puedan encontrar los elementos. El sistema también necesita saber cuándo se agrega contenido nuevo, lo que generalmente significa la configuración de navegación por fecha o un mapa del sitio con enlaces a URLs de nivel de elemento. Estas dos primeras configuraciones están activadas de forma predeterminada en DSpace.
Pablo Crespo
30:02
Finalmente, para identificar los metadatos de las publicaciones que encuentra, el sistema de Google Académico requiere acceso a los metadatos legibles por máquina para estos elementos. Estos metadatos legibles por máquina utilizados por Google Académico se denominan metaetiquetas, que inician con la palabra "citation” más un guión bajo. A veces se les llama también "etiquetas de HighWire Press" o "etiquetas de Google Scholar". La imagen de la derecha muestra una conjunto típico de metaetiquetas. Se ha tomado de nuestras pautas de inclusión, que compartiré más adelante. Las metaetiquetas en el cuadro verde contienen metadatos bibliográficos usuales, como los nombres de los autores y la fecha de publicación. Estas metaetiquetas también admiten datos de autor ORCID.
Pablo Crespo
30:20
-
Pablo Crespo
30:42
La última metaetiqueta, en el cuadro rojo, le dice al sistema de indexación la ubicación del archivo al que pertenece este metadato.
Pablo Crespo
30:49
-
Pablo Crespo
30:58
Estas metaetiquetas están activadas de forma predeterminada para DSpace y DSpace-CRIS. Pueden revisar las metaetiquetas de un elemento en su repositorio yendo a la página del elemento, y luego mostrando el código fuente HTML. Por lo general, puede hacer esto haciendo clic con el botón derecho en la página y seleccionando "Ver código fuente de la página" o usando un comando del teclado, dependiendo del navegador que use. Una vez que esté en el código fuente HTML, puede buscar todas las instancias de "citation_" para ver la lista de metatags. Este proceso se puede usar para probar y solucionar muchos de los errores de indexación del repositorio que describiré en esta presentación.
Pablo Crespo
31:23
-
Pablo Crespo
31:33
-
Pablo Crespo
31:35
Cuando revise los metatags de un elemento, siempre querrá compararlos con los metadatos en la versión del registro, es decir, por ejemplo, con el PDF o la versión del editor del artículo. Aquí puede ver la versión del registro encima de las metaetiquetas de la versión de este documento en el repositorio. Estas metaetiquetas se ven muy bien. Las fechas de publicación, resaltadas en rojo, coinciden. Los autores están destacados en verde. Observen que las metaetiquetas del autor están en el mismo que los autores en la versión del registro. Además, observen que dado que el resumen, destacado en celeste, está escrito en portugués, también lo están los metatags. Voy a entrar en más detalles sobre estas mejores prácticas pronto.
Pablo Crespo
32:23
-
Pablo Crespo
32:29
He dedicado mucho tiempo al inicio a las metaetiquetas bibliográficas porque esta es, con mucho, el área más común para errores de repositorio cuando se trata de la indexación en Google Académico. La indexación en Google Académico requiere metaetiquetas precisas -- y metadatos incorrectos se traducen en autores descontentos y artículos no clasificados como deberían, por falta de citas. El sistema de indexación detecta automáticamente los sitios con frecuentes errores de metadatos y deja de incluirlos. Si su repositorio se ha eliminado del índice de Google Académico, podría deberse a errores frecuentes de metadatos.
Pablo Crespo
33:16
-
Pablo Crespo
33:23
Hay un par de otras causas para los errores de indexación del repositorio. Deben evitarse las interrupciones del sitio, y recomiendo que conserven la configuración que DSpace trae predeterminada para el acceso a los rastreadores. Discutiré brevemente esto hacia el final de mi presentación.
Pablo Crespo
33:29
-
Pablo Crespo
33:31
La fecha de publicación es una pieza crucial de metadatos para la indexación de artículos académicos. Otras fechas, como la fecha en que se cargó un documento al repositorio, no deben usarse en su reemplazo si la fecha de publicación no está disponible; es mejor no incluir una metaetiqueta de fecha de publicación que una incorrecta.
Pablo Crespo
33:45
Si la fecha de publicación en la metaetiqueta citation_date no coincide con la fecha de publicación en la versión de registro, es una bandera roja para el sistema de indexación. Aquí puede ver un ejemplo típico, donde la fecha de publicación en la etiqueta de identificación del repositorio es posterior a la fecha de publicación real del elemento. Esto sugiere que se incluyó accidentalmente como fecha de publicación la fecha en que el PDF estuvo disponible en línea o que se subió al repositorio, que es el tipo más común de error de fecha de publicación.
Pablo Crespo
34:21
Para probar si tiene este problema, revisar el código HTML le permitirá ver la etiqueta citation_date para las publicaciones en su repositorio. Compare esto con las fechas de publicación que figuran en la versión de registro y mire si estas fechas son las mismas. Si el problema está muy extendido en su repositorio, y parece que la fecha de puesta en línea se da como la fecha de publicación, hay un parche de DSpace que ha sido desarrollado por la comunidad específicamente para solucionar este problema. Este parche garantizará que solo se use la fecha de publicación en la etiqueta citation_date.
Pablo Crespo
34:53
-
Pablo Crespo
34:58
A diferencia de otras metaetiquetas, el orden de las metaetiquetas de autor es importante, ya que controla el orden en que aparecen los autores en los resultados de búsqueda de Google Académico. La metaetiqueta de autor con el nombre del primer autor de una publicación debe aparecer en el código HTML antes de la metaetiqueta de autor con el nombre del segundo autor, y así sucesivamente. Aquí pueden ver un ejemplo en el que este orden ha salido mal. No solo los autores, especialmente el primer autor, estarán descontentos con el orden del autor resultante en los metadatos, sino que, si esto ocurre muchas veces para un repositorio, el sistema de indexación de Scholar se verá forzado a dejar de indexarlo.
Pablo Crespo
35:43
Para probar los errores de orden de autor, compare el orden de las metaetiquetas de autor con el orden de los autores en la versión de registro. Si encuentra inconsistencias, hay algunas potenciales soluciones.
Pablo Crespo
36:06
-
Pablo Crespo
36:07
Existe un error conocido para las versiones 5.0, 5.1, 5.2 y 5.3 de DSpace que crea un orden de autores incorrecto. Si está utilizando una de estas versiones, puede aplicar este parche de DSpace para corregir este error, o bien actualizar a la versión 5.4 o posterior de DSpace.
Pablo Crespo
36:19
-
Pablo Crespo
36:22
También recomiendo verificar si su repositorio está enumerando a los autores de la institución primero de manera predeterminada. Esto puede suceder más a menudo cuando el repositorio también se está utilizando como CRIS. Será útil educar a cualquier persona que trabaje en el repositorio sobre la importancia de un correcto orden de autores en los metadatos que ingresan.
Pablo Crespo
36:37
-
Pablo Crespo
36:39
No incluir a todos los autores de un artículo en las metaetiquetas de autor es otro problema común en algunos repositorios. La mayoría de las veces, cuando esto sucede, solo se incluye a los autores de la institución. Esto también es particularmente común para los híbridos CRIS-repositorio. Si su repositorio tiene este error, simplemente agregue los autores que faltan en las metaetiquetas. ¡En el orden correcto, por supuesto!
Pablo Crespo
36:53
También a veces vemos el problema opuesto de demasiados autores incluidos en las metaetiquetas. Aquí, en mi clásico ejemplo de una tesis muy temática de California, pueden ver el caso más común de incluir demasiados autores en las metaetiquetas, que incluye al asesor de la tesis como autor. Solo el autor de la tesis debe incluirse como autor en las metaetiquetas de autor.
Pablo Crespo
37:26
-
Pablo Crespo
37:30
A veces, las metaetiquetas incluyen información que no corresponde, como el nombre del repositorio o el tipo de documento. Esto es especialmente común en metaetiquetas de título. En primer lugar, recomiendo evitar agregar cualquier otro elemento que no sea información bibliográfica del artículo a las metaetiquetas, y segundo, eliminar cualquier información no bibliográfica de las metaetiquetas que encuentre.
Pablo Crespo
37:50
-
Pablo Crespo
37:52
-
Pablo Crespo
37:59
El último error común de metaetiquetas es la combinación de varios idiomas o alfabetos en las metaetiquetas de una única publicación, lo que resulta en información bibliográfica mixta, a menudo duplicada. Esto causa confusión tanto para el sistema de indexación de Google Académico como para los investigadores que pueden, por ejemplo, hacer clic en un resultado de búsqueda de Google Académico que parece ser un artículo escrito en un idioma familiar, y terminar en un PDF que no pueden leer.
Pablo Crespo
38:24
-
Pablo Crespo
38:25
-
Pablo Crespo
38:28
La solución para este problema es usar el idioma del texto completo si lo tiene, o en su defecto del resumen, como una guía para el idioma que se usará en las metaetiquetas de la publicación. No duplique esta información, ya sea dentro de una misma metaetiqueta o en múltiples metaetiquetas con diferentes alfabetos. Si también tiene una versión traducida de la publicación, la mejor práctica es darle a cada versión su propio registro separado en el repositorio, con metaetiquetas en ese idioma.
Pablo Crespo
38:58
-
Pablo Crespo
39:03
Con eso, ya han visto la causa de los principales errores en repositorios DSpace.
Pablo Crespo
39:19
.
Pablo Crespo
39:21
Con menos frecuencia, ocasionalmente hay casos en que el rastreador no puede encontrar los elementos en su repositorio, ya sea porque el sitio está inactivo o porque algún tipo de configuración del sitio ha bloqueado activamente el rastreador. Procure evitar que su sitio quede inactivo durante un período de tiempo significativo para reducir las posibilidades de que el rastreador esté tratando de encontrar sus publicaciones mientras están inaccesibles. Y como mencioné anteriormente, la configuración predeterminada de DSpace para rastreadores funciona bien. Casi nunca hay necesidad de ajustarla.
Pablo Crespo
39:48
Asegúrese de configurar redirecciones si su repositorio migra a un nuevo dominio, o si renumera los elementos.
Pablo Crespo
40:08
Los formularios intersticiales, ya sean formularios de registro o aceptación de términos de uso por única vez, causan problemas para los sistemas de indexación y, a menudo, son percibidos como encubrimientos.
Pablo Crespo
40:21
en sata sección es el mismo slide
Pablo Crespo
40:44
Y las páginas de portada pueden provocar una disminución sistemática de la cobertura de su repositorio, pues a menudo estropean la extracción automática de metadatos.
Pablo Crespo
40:51
-
Pablo Crespo
40:52
-
Pablo Crespo
40:53
Ahora que saben cómo detectar y solucionar los errores más comunes que pueden causar que sus repositorios sean eliminados del índice de Google Académico, quiero asegurarme de que también sepan cómo realizar correctamente una verificación de cobertura. Quiero comenzar haciendo hincapié en lo que no funciona, que es utilizar el número de resultados de búsqueda del sitio de su repositorio en la búsqueda de Google Académico. La cantidad de resultados que vea será inexacta porque estos números solo se aplican a los enlaces principales. Como describí anteriormente, la versión del repositorio de un elemento a menudo no es el enlace principal, sino que se encuentra detrás del enlace "Las # las versiones". Eso significa que el número que verá como el recuento resultante para su sitio probablemente será muy inferior al número real de elementos indexados.
Pablo Crespo
42:25
-
Pablo Crespo
42:28
En lugar de ello, la mejor manera de verificar la cobertura de Scholar es elegir al azar varios elementos seleccionados de diferentes colecciones de su repositorio y buscar estos títulos en Scholar. Asegúrese de hacer clic en el enlace "Las # versiones" para ir a la página de todas las versiones, como se ilustra aquí, y luego ver si hay un enlace a la versión de su repositorio. Si para todos estos títulos encuentran enlaces a las versiones de su repositorio, están en buena forma. Si no es así, ¡ahora saben cómo comenzar a solucionar problemas!
Pablo Crespo
42:55
-
Pablo Crespo
42:56
-
Pablo Crespo
42:59
Antes de pasar a las preguntas, quiero terminar compartiéndoles algunas referencias y pautas realmente útiles sobre Google Académico. La primera es la documentación de Google Académico. Si ingresa a scholar punto google punto com y hace clic en "Ayuda" en la esquina inferior derecha de la página, será llevado a nuestra documentación. A partir de ahí, la sección titulada "Inclusión" les brinda una visión global del proceso de indexación. Incluye la lista de ejemplos de metaetiquetas que les mostré, junto con las pautas de solución de problemas de las que hablé hoy, y algunas más.
Pablo Crespo
43:31
También les recomiendo las diapositivas de una presentación que el fundador de Google Académico, Anurag Acharya, dio en la conferencia Open Repositories hace unos años. Se enfoca en una gama de plataformas de repositorio y proporciona un contexto útil para las mejores prácticas recomendadas por Google Académico para los repositorios.
Pablo Crespo
43:50
-
Pablo Crespo
43:52
-
Pablo Crespo
43:56
¡Gracias!Compartiré estas diapositivas más adelante esta semana con todos los que se registraron para este seminario web. No es demasiado tarde para registrarse si desean recibirlas.
Michele Mennielli
45:12
The slides and the recording will be here: https://wiki.duraspace.org/display/DSPACE/Grupo+Ecuatoriano+de+Usuarios+de+DSpace
Monica Westin
46:20
My email: mwestin@google.com
Monica Westin
51:44
Puede enviarme un correo electrónico con preguntas relacionadas con la cobertura de su repositorio en Google Scholar. :)
Michele Mennielli
51:54
https://wiki.duraspace.org/pages/viewpage.action?pageId=150798338