library(tidyverse)
library(sf)
library(ggplot2)
library(plotly)
library(gganimate)
library(palmerpenguins)
library(colorspace)
library("readxl")
library(viridis)
library(geojsonsf)
library(ggthemes)
library(treemap)
library(openxlsx)
library(treemapify)
1. La introducción
La introducción:El Sorteo Extraordinario de Navidad, también conocido como Lotería de Navidad, es uno de los sorteos de lotería más importantes y populares que se celebra en España cada 22 de diciembre. Se divide principalmente en 5 clases: el gordo, 4 000 000 €; 2º premio, 1 250 000 €; 3º premio, 500 000 €; 4º premio, con dos números, 200 000 € cada uno; 5º premio, con 8 números, 60 000 € cada uno; reintegro, 20 € si el último número es el mismo que el último número de gordo.El número específico de ganancias para cada billete de lotería depende del número de serie.
Primero hay que instalar y cargar unos paquetes necesarios.
2.¿Dónde se ha tocado más el gordo?
Aquí está la distribución de gordo en España a lo largo de su historia, tanto en orden alfabético como su valor
Código
<- "./datos/provincia y gordo.csv"
la_direccion <- rio::import(la_direccion)
provincia_gordo <- pjpv.curso.R.2022::LAU2_prov_2020_canarias
prov
ggplot(provincia_gordo,aes(province,veces,fill=province))+geom_bar(stat='identity')+coord_flip()+geom_text(aes(label=veces),
position = position_dodge2(width = 0.5, preserve = 'single'),
size= 3, hjust = 0 )+
lims(y=c(0,125))+
scale_y_continuous(limits = c(0,125), expand = c(0, 0))+
labs(title = "Número de veces que ha tocado cada provincia en orden alfabetico",
subtitle = "(un rollo)")
Código
#con orden
ggplot(provincia_gordo,aes(x= reorder(province,veces),y= veces,fill=province))+geom_bar(stat='identity')+coord_flip()+geom_text(aes(label=veces), position = position_dodge2(width = 0.5, preserve = 'single'),size= 3, hjust = 0 )+
lims(y=c(0,125))+
scale_y_continuous(limits = c(0,125), expand = c(0, 0))+
labs(title = "Número de veces que ha tocado el gordo cada provincia en funcion de veces",
x = "Provincias")+
theme(title=element_text(family="myFont",size=14,color="black",face="italic"),
axis.title.x=element_text(size=10,face="bold",color="black",hjust=0.5),
legend.title=element_text(size=14,color="red",hjust=0.5))
2.1 Datos reordenados pero con treemap
Con treepmap, podemos tener una comprensión más intuitiva del número y la comparación del número de veces que se ha tocado entre las provincias: podemos ver que Madrid es la comunidad / provincia más afortunada:107 veces, seguida por Barcelona. Y lo peor es Melilla, a quien nunca le ha tocado el Gordo en los 200 años de historia de la lotería de Navidad.
Código
#Tree map
library(treemap)
library(openxlsx)
install.packages("treemapify")
library(treemapify)
<- ggplot(data = provincia_gordo,aes(fill= province,area= veces, label= paste0(province,"\n",veces)))
ptree <- ptree + geom_treemap()
ptree <- ptree + geom_treemap_text(colour="white", place= "centre")
ptree <- ptree + theme(legend.position = "none")
ptree <- ptree + labs(title = "treemap de gordo:Número de veces que ha tocado el gordo cada provincia",
ptree subtitle = "(Melilla: 0)")+
theme(title=element_text(family="myFont",size=14,color="black",face="italic"))
ptree
3.La provincia más afortunada
Sin embargo, la lotería de navidad no es el “Gordo” solamente, los premios del segundo, tercer, cuarto y quinto premio también son muy atractivos, aunque los premios son menores que lo del gordo. Para calcular de manera más justa la “provincia más afortunada”, asignamos puntos según la proporción de premio: 200/3 al Gordo, 125/6 a segundo premio, 25/3 a tercer premio, 10/3 a cuarto premio y 1 a quinto premio.
Solo considero la distribución del mismo número en todo el país por provincias, no considero números de series que están disponible en cada provincia ni “Centena (tres primeras cifras) del primero premio,etc”, porque ya es mucho trabajo y tengo que copiar los datos desde los períodicos y recopilarlos. ——————Qiu Kaikai
Podemos que la provincia más afortunada es Cantabria, seguida por Madrid.
Código
##3.la provincia más afortunada(de todas las provincias)
<- read_excel("./datos/todo.xlsx")
todo <- todo %>% mutate(punto= primero*200/3+ segundo*125/6+ tercero*25/3+ cuarto*10/3+ quinto)
todop <- pjpv.curso.R.2022::LAU2_prov_2020_canarias
prov <- full_join(todop, prov, by = c("ine" = "ine_prov"))
df_todo
<- ggplot() +
ptodo geom_sf(data = df_todo,
aes(geometry = geometry,fill = punto),
size = 0.09) +
scale_fill_viridis_c(option = "plasma")+
labs(title = "Puntos según todos los premio de 2021",
caption = "datos viene de loteriasyapuestas.es") +
theme(plot.title=element_text
family="Times",size=18,hjust = 0.5,color="black",face="bold"),
(legend.title=element_text(size=12,face="bold",color="black",hjust=0.5))+
theme(plot.background = element_rect(fill = "white"),
panel.background = element_rect(fill = "grey"))+
annotate(geom = "text",x= -4.03,y= 45.2,label="La provincia más afortunada: \n Cantabria",size=4.5)+
geom_segment(aes(x= -4.03, y= 44.6, xend= -4.03, yend= 43.2), size=1.5, arrow = arrow(length = unit(0.3,"cm")))
ptodo
4. El gasto medio por habitante en loteria por CCAA y provincia, 2021
Comprar boletos de lotería de Navidad parece ser una costumbre navideña nacional, cuanto más cerca del 22 de diciembre, más larga es la fila afuera de Loterías y Apuestas del Estado. Pero las personas en diferentes lugares gastan diferentes cantidades de dinero en la lotería de Navidad. Los dos gráficos siguientes muestran el gasto medio de los residentes de diferentes comunidades autónomas y provincias en la lotería de Navidad.
4.1 A nivel Comunidades Autónomas
Puede poner el cursor por el territorio de cada comunidad autónoma para conocer el dato concreto. Podemos ver que Castilla y León es el líder de todo el país, mientras que en Ceuta y Melilla los gastos son menor de 20 euros.
Código
##4.El gasto medio por habitante en loteria por CCAA y provincia, 2021
library("readxl")
<- read_excel("./datos/gasto_ccaa.xlsx")
my_data library(tidyverse)
library(sf)
library(viridis)
<- pjpv.curso.R.2022::LAU2_prov_2020_canarias
prov <- prov %>% select(ine_prov, ine_prov.n, ine_ccaa, ine_ccaa.n)
prov <- prov %>%
df_geo_ccaa group_by(ine_ccaa, ine_ccaa.n) %>% summarize() %>% ungroup()
<- full_join(df_geo_ccaa, my_data, by = c("ine_ccaa" = "codigo"))
df_ok ##CCAA color
= sf::st_cast(df_ok, "MULTIPOLYGON")
df_ok <- ggplot(data = df_ok,
p aes(geometry = geometry,fill = gasto),
size = 0.09) +
geom_sf() + scale_fill_viridis(option="magma")+
labs(title = "Gasto medio por habitante en lotería de navidad, CCAA",
caption = "datos viene de loteriasyapuestas.es",
fill = "gasto medio") +
theme(plot.title=element_text
family="Times",size=18,hjust = 0.5,color="black",face="bold"),
(legend.title=element_text(size=12,face="bold",color="black",hjust=0.5))
ggplotly(p)