Por ejemplo: En una base de datos se indica los contratos que ha adquirido cierta empresa, en el campo de fecha de contratación los datos se han introducido con diferentes formatos, también se observan las áreas de los diferentes contratos, algunas escritas en siglas o por su significado. Si se realiza una gráfica de esta columna, se obtendrán áreas inexistentes o que pertenecen a un área general, para arreglar este problema se utilizará un limpiador de datos, por lo que se deben seguir estos pasos:
· Ejecuta el software de limpieza, este te abrirá una nueva ventana en tu navegador de Internet.
·
Da clic en el botón Create
Project.
·
Elige el archivo a limpiar, de
preferencia con formato .csv.
·
Da clic en Next y después Create
Project. Si gustas puedes cambiar de nombre al proyecto.
·
Ahora que tienes la base de datos
en el software, da clic en el encabezado de la columna de área y selecciona
Text facet.
·
Se pueden observar que existen
varios tipos de áreas del lado izquierdo, también se ve el número de registros
que se referencian a esa área. Como se puede observar, existen áreas idénticas.
Sigue estos pasos para depurar la información:
·
Elige el nombre que más registros
tenga, da clic en Editar y cópialo. Para los otros nombres similares, da clic
en Editar y borra el nombre que tenían.
·
Pega el nombre que copiaste
anteriormente y da clic en Apply, observarás que el número de registros del
nombre seleccionado van incrementando, ya que estás homologando los nombres de
las áreas.
·
Tienes que realizar este
procedimiento cada vez que veas nombres similares en las celdas, y siempre que
tengas dudas de similitud, consúltalo primero con tu superior inmediato.
Fundación Carlos Slim – Curso Analista de Datos.
Playtech acquires Playtech for $3.1 billion in - JtmHub
ResponderBorrarPlaytech has acquired Playtech for approximately US$3.1 billion and a US$3.1 billion 김포 출장안마 cash-out in a 양주 출장샵 deal 전라북도 출장샵 to offer 김제 출장샵 online 포항 출장샵 gambling