Considera los siguientes datos para fines ilustrativos:
scatterplot
Para crear un gráfico de dispersión en Python con seaborn puedes usar la función scatterplot
o relplot
. Tienes varias opciones para pasar tus datos: puedes pasar tus variables para los ejes X e Y a los argumentos x
e y
como arrays, pasar un conjunto de datos al argumento data
y establecer los nombres de las variables o pasar un data frame al argumento data
con el formato adecuado. Los símbolos serán azules por defecto.
Color de los símbolos
En caso de que quieras sobrescribir el color por defecto de los símbolos puedes especificar un nuevo color con el argumento color
de la función.
Color del borde
Ten en cuenta que también puedes modificar el color de los símbolos con edgecolor
, que por defecto es blanco. En caso de que quieras eliminar los bordes establece edgecolor = "none"
, edgecolor = None
o linewidth = 0
.
Transparencia
El argumento alpha
de la función controla la transparencia de los símbolos. Esto es muy útil cuando hay muchos datos y los puntos se superponen unos encima de otros. De esta manera, se pueden ver las zonas de mayor densidad.
Color en base a una variable
Si pasas una variable al argumento hue
de la función scatterplot
los símbolos del gráfico se colorearán en base a esa variable.
Tamaño de los símbolos
Dependiendo de tus datos tendrás que modificar el tamaño de los símbolos del gráfico. Por ejemplo, si tienes muchas observaciones podrías considerar reducir el tamaño de los símbolos con el argumento size
.
Forma de los símbolos
Por defecto, los símbolos del gráfico de dispersión son círculos, pero puedes seleccionar entre una gran variedad de formas con el argumento marker
. Por ejemplo, si pasamos "s"
los símbolos serán cuadrados.
Tamaño de los símbolos en base a una variable
El argumento size
también permite pasar una variable como input. En este escenario, el tamaño de los símbolos se basará en el valor de esa variable.
También te puede interesar