{"id":1825,"date":"2021-10-31T10:56:00","date_gmt":"2021-10-31T09:56:00","guid":{"rendered":"https:\/\/ecoper.eu\/es\/?p=1825"},"modified":"2021-11-25T10:59:32","modified_gmt":"2021-11-25T09:59:32","slug":"web-crawling-y-web-scraping","status":"publish","type":"post","link":"https:\/\/ecoper.eu\/es\/2021\/10\/31\/web-crawling-y-web-scraping\/","title":{"rendered":"Web crawling y web scraping"},"content":{"rendered":"\n<p>ECOPER ha incorporado a su \u00e1rea de an\u00e1lisis y evaluaci\u00f3n dos nuevos tipos de herramientas de inteligencia artificial para analizar grandes cantidades de datos provenientes de internet (big data). Se trata de herramientas de web crawling y web scraping.<\/p>\n\n\n\n<p>El web crawling o rastreo web es un proceso por el cual un \u201crobot\u201d (en este caso, un algoritmo) llamado crawler navega sistem\u00e1ticamente a trav\u00e9s de internet. El crawler dispone de un conjunto inicial de URLs, conocidas como semillas, y descarga las p\u00e1ginas web asociadas a las semillas para buscar, a su vez, URLs dentro de estas. Estas nuevas URLs se a\u00f1aden a la lista de enlaces que el rastreador debe visitar, y as\u00ed sucesivamente hasta llegar al nivel m\u00e1ximo de iteraciones establecido por el programador.<\/p>\n\n\n\n<p>En paralelo, el web scraping o raspado web extrae informaci\u00f3n relevante de dichas p\u00e1ginas. Ya se ha contado en una <a href=\"https:\/\/ecoper.eu\/es\/2021\/08\/30\/siguiendo-la-actividad-de-las-redes-de-ciudades\/\" data-type=\"post\" data-id=\"1809\">entrada anterior<\/a> que ECOPER cuenta con un diccionario general de la Agenda 2030. El web scraping permitir\u00eda, por ejemplo, buscar t\u00e9rminos clave de la Agenda en las p\u00e1ginas web recolectadas por el crawler.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>ECOPER ha incorporado a su \u00e1rea de an\u00e1lisis y evaluaci\u00f3n dos nuevos tipos de herramientas de inteligencia artificial para analizar grandes cantidades de datos provenientes de internet (big data). Se trata de herramientas de web crawling y web scraping. El web crawling o rastreo web es un proceso por el cual un \u201crobot\u201d (en este &#8230; <\/p>\n<p class=\"read-more-container\"><a title=\"Web crawling y web scraping\" class=\"read-more button\" href=\"https:\/\/ecoper.eu\/es\/2021\/10\/31\/web-crawling-y-web-scraping\/#more-1825\" aria-label=\"M\u00e1s en Web crawling y web scraping\">Leer m\u00e1s<\/a><\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_generate-full-width-content":""},"categories":[254],"tags":[],"country":[],"subject":[],"region":[],"sdg":[],"cliente":[],"pais":[],"_links":{"self":[{"href":"https:\/\/ecoper.eu\/es\/wp-json\/wp\/v2\/posts\/1825"}],"collection":[{"href":"https:\/\/ecoper.eu\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/ecoper.eu\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/ecoper.eu\/es\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/ecoper.eu\/es\/wp-json\/wp\/v2\/comments?post=1825"}],"version-history":[{"count":1,"href":"https:\/\/ecoper.eu\/es\/wp-json\/wp\/v2\/posts\/1825\/revisions"}],"predecessor-version":[{"id":1828,"href":"https:\/\/ecoper.eu\/es\/wp-json\/wp\/v2\/posts\/1825\/revisions\/1828"}],"wp:attachment":[{"href":"https:\/\/ecoper.eu\/es\/wp-json\/wp\/v2\/media?parent=1825"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/ecoper.eu\/es\/wp-json\/wp\/v2\/categories?post=1825"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/ecoper.eu\/es\/wp-json\/wp\/v2\/tags?post=1825"},{"taxonomy":"country","embeddable":true,"href":"https:\/\/ecoper.eu\/es\/wp-json\/wp\/v2\/country?post=1825"},{"taxonomy":"subject","embeddable":true,"href":"https:\/\/ecoper.eu\/es\/wp-json\/wp\/v2\/subject?post=1825"},{"taxonomy":"region","embeddable":true,"href":"https:\/\/ecoper.eu\/es\/wp-json\/wp\/v2\/region?post=1825"},{"taxonomy":"sdg","embeddable":true,"href":"https:\/\/ecoper.eu\/es\/wp-json\/wp\/v2\/sdg?post=1825"},{"taxonomy":"cliente","embeddable":true,"href":"https:\/\/ecoper.eu\/es\/wp-json\/wp\/v2\/cliente?post=1825"},{"taxonomy":"pais","embeddable":true,"href":"https:\/\/ecoper.eu\/es\/wp-json\/wp\/v2\/pais?post=1825"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}