Historia visual de los ganadores del Premio Nobel

El más Nobel de los premios

El Premio Nobel es quizás el premio científico más conocido del mundo. Además del honor, el prestigio y una considerable suma de dinero como premio, el destinatario recibe también una medalla de oro con la imagen de Alfred Nobel (1833-1896), quien instituyó el premio en 1895. Cada año se entrega a científicos y académicos en las categorías química, literatura, física, fisiología o medicina, economía y paz. El primer Premio Nobel se entregó en 1901, y en ese momento el Premio era muy Eurocéntrico y centrado en los hombres, aunque hoy en día ya no está sesgado de ninguna manera. Seguro… ¿No? 🤔

Bueno ok, vamos a averiguarlo! La Fundación Nobel ha puesto a disposición un dataset con todos los ganadores del premio desde el comienzo del mismo, en 1901, hasta 2016. Vamos a cargarlo y echar un vistazo.

# Cargamos las librerías necesarias
import pandas as pd
import seaborn as sns
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

# Establecemos el theme para Seaborn
sns.set()
# y el tamaño para todos los gráficos
plt.rcParams['figure.figsize'] = [18, 7]

# Cargamos el dataset
nobel = pd.read_csv("datasets/nobel.csv")

# Veamos que contiene
nobel.info()
RangeIndex: 911 entries, 0 to 910
Data columns (total 18 columns):
year                    911 non-null int64
category                911 non-null object
prize                   911 non-null object
motivation              823 non-null object
prize_share             911 non-null object
laureate_id             911 non-null int64
laureate_type           911 non-null object
full_name               911 non-null object
birth_date              883 non-null object
birth_city              883 non-null object
birth_country           885 non-null object
sex                     885 non-null object
organization_name       665 non-null object
organization_city       667 non-null object
organization_country    667 non-null object
death_date              593 non-null object
death_city              576 non-null object
death_country           582 non-null object
dtypes: int64(2), object(16)
memory usage: 128.2+ KB
# Y un vistazo a la información
nobel.head(10)

yearcategoryprizemotivationprize_sharelaureate_idlaureate_typefull_namebirth_datebirth_citybirth_countrysexorganization_nameorganization_cityorganization_countrydeath_datedeath_citydeath_country
01901ChemistryThe Nobel Prize in Chemistry 1901"in recognition of the extraordinary services ...1/1160IndividualJacobus Henricus van 't Hoff1852-08-30RotterdamNetherlandsMaleBerlin UniversityBerlinGermany1911-03-01BerlinGermany
11901LiteratureThe Nobel Prize in Literature 1901"in special recognition of his poetic composit...1/1569IndividualSully Prudhomme1839-03-16ParisFranceMaleNaNNaNNaN1907-09-07ChâtenayFrance
21901MedicineThe Nobel Prize in Physiology or Medicine 1901"for his work on serum therapy, especially its...1/1293IndividualEmil Adolf von Behring1854-03-15Hansdorf (Lawice)Prussia (Poland)MaleMarburg UniversityMarburgGermany1917-03-31MarburgGermany
31901PeaceThe Nobel Peace Prize 1901NaN1/2462IndividualJean Henry Dunant1828-05-08GenevaSwitzerlandMaleNaNNaNNaN1910-10-30HeidenSwitzerland
41901PeaceThe Nobel Peace Prize 1901NaN1/2463IndividualFrédéric Passy1822-05-20ParisFranceMaleNaNNaNNaN1912-06-12ParisFrance
51901PhysicsThe Nobel Prize in Physics 1901"in recognition of the extraordinary services ...1/11IndividualWilhelm Conrad Röntgen1845-03-27Lennep (Remscheid)Prussia (Germany)MaleMunich UniversityMunichGermany1923-02-10MunichGermany
61902ChemistryThe Nobel Prize in Chemistry 1902"in recognition of the extraordinary services ...1/1161IndividualHermann Emil Fischer1852-10-09EuskirchenPrussia (Germany)MaleBerlin UniversityBerlinGermany1919-07-15BerlinGermany
71902LiteratureThe Nobel Prize in Literature 1902"the greatest living master of the art of hist...1/1571IndividualChristian Matthias Theodor Mommsen1817-11-30GardingSchleswig (Germany)MaleNaNNaNNaN1903-11-01CharlottenburgGermany
81902MedicineThe Nobel Prize in Physiology or Medicine 1902"for his work on malaria, by which he has show...1/1294IndividualRonald Ross1857-05-13AlmoraIndiaMaleUniversity CollegeLiverpoolUnited Kingdom1932-09-16Putney HeathUnited Kingdom
91902PeaceThe Nobel Peace Prize 1902NaN1/2464IndividualÉlie Ducommun1833-02-19GenevaSwitzerlandMaleNaNNaNNaN1906-12-07BernSwitzerland

Asi que… quienes obtienen el Premio Nobel?

Tan solo mirando a los primeros ganadores del premio, ya vemos a una celebridad: Wilhelm Conrad Röntgen, el físico e ingeniero alemán que descubrió los rayos X. Y, de hecho, vemos que todos los ganadores en 1901 fueron hombres provenientes de Europa. Pero eso fue en 1901, mirando a todos los ganadores en el conjunto de datos, de 1901 a 2016, ¿qué sexo y de qué país son los más comúnmente representados?

(Para el país, utilizaremos el país de nacimiento “birth_date” del ganador, ya que el país de organización “organization_country” es NaN para todos los Premios Nobel compartidos).

# Premios Nobel entregados entre 1901 y 2016
print("Cantidad de premios Nobel entregados hasta 2016: " + str(len(nobel)))
Cantidad de premios Nobel entregados hasta 2016: 911
# Número de premios entregados según sexo del ganador
nobel["sex"].value_counts()
Male      836
Female     49
Name: sex, dtype: int64
# Top 10 de nacionalidades con mayor cantidad de premios entregados
nobel["birth_country"].value_counts().head(10)
United States of America    259
United Kingdom               85
Germany                      61
France                       51
Sweden                       29
Japan                        24
Canada                       18
Netherlands                  18
Russia                       17
Italy                        17
Name: birth_country, dtype: int64

Dominación de EE.UU.

Quizás no sea tan sorprendente: el premio Nobel más típico entre 1901 y 2016 fue para hombres nacidos en los Estados Unidos de América. Pero en 1901 todos los ganadores eran europeos. ¿Cuándo comenzó Estados Unidos a dominar las listas del Premio Nobel?

# Creamos una columna para ganadores estadounidense
nobel["usa_born_winner"] = nobel["birth_country"].apply(lambda x: True if x == "United States of America" else False)

# Creamos una columna con la década en que fue otorgado el premio
nobel["decade"] = nobel["year"].apply(lambda x: x - (x % 10))

# Calculamos la proporción de ganadores estadounidenses por década
prop_usa_winners = nobel.groupby("decade", as_index=False)["usa_born_winner"].mean()

# Proporción de ganadores estadounidenses por década
print(prop_usa_winners)
    decade  usa_born_winner
0     1900         0.017544
1     1910         0.075000
2     1920         0.074074
3     1930         0.250000
4     1940         0.302326
5     1950         0.291667
6     1960         0.265823
7     1970         0.317308
8     1980         0.319588
9     1990         0.403846
10    2000         0.422764
11    2010         0.292683

Conviene mejor visualizarlo con un gráfico

# Creamos gráfico de línea para la proporción de ganadores estadounidenses
ax = sns.lineplot(x="decade", y="usa_born_winner", data=nobel, ci=False)

# Agregamos formato porcentual para el eje y
from matplotlib.ticker import PercentFormatter
ax.yaxis.set_major_formatter(PercentFormatter(1.0))

# Establecemos el nombre de los ejes
ax.set_ylabel("Proporcion de ganadores nacidos en EE.UU.")
ax.set_xlabel("Década")

plt.show()

¿Cuál es el género de un típico ganador del Premio Nobel?

Como podemos observar, Estados Unidos se convirtió en el ganador dominante del Premio Nobel por primera vez en la década de 1930 y mantiene la posición de liderazgo desde entonces. Pero un grupo que estuvo a la cabeza desde el principio, y que nunca parece ceder terreno, son los hombres. Tal vez no debería sorprender que haya algún desequilibrio entre ganadores de premios masculinos y femeninos, pero ¿qué tan significativo es este desequilibrio? ¿Y es mejor o peor dentro de cada una de las categorías específicas como física, medicina, literatura, etc.?

# Creamos una columna para las ganadoras femeninas
nobel["female_winner"] = nobel["sex"].apply(lambda x: True if x == "Female" else False)

# Calculamos la proporción de ganadoras femeninas a lo largo de las décadas y para cada categoría
prop_female_winners = nobel.groupby(["decade","category"], as_index=False)["female_winner"].mean()

# Creamos gráfico de líneas
ax = sns.lineplot(x="decade", y="female_winner", data=nobel, ci=False, hue="category")

# Agregamos formato porcentual para el eje y
ax.yaxis.set_major_formatter(PercentFormatter(1.0))

# Establecemos el nombre de los ejes
ax.set_ylabel("Proporción de ganadoras femeninas")
ax.set_xlabel("Década")

plt.show()

Primera mujer en ganar el Premio Nobel

El gráfico anterior quedó bastante confuso ya que las líneas se superponen, pero muestra algunas tendencias y patrones interesantes. En general, el desequilibrio es bastante grande, sobre todo en física, economía y química que tienen las menores proporciones. Medicina tiene una tendencia algo positiva, y desde la década de 1990 el premio de literatura está más equilibrado. El gran valor atípico es el premio de la paz durante la década de 2010, pero tengamos en cuenta que esto solo cubre los años 2010 a 2016.

Dado este desequilibrio, ¿quién fue la primera mujer en recibir un Premio Nobel? ¿Y en qué categoría?

# Filtramos las mujeres y nos quedamos con la ganadora más antigua
nobel[nobel["sex"] == "Female"].nsmallest(1, "year")[["year","full_name","category"]]

yearfull_namecategory
191903Marie Curie, née SklodowskaPhysics

Ganadores repetidos

Para la mayoría de los científicos / escritores / activistas, un Premio Nobel sería el mayor logro de una larga carrera. Pero para algunas personas, uno simplemente no es suficiente, y pocos lo han conseguido más de una vez. ¿Quiénes son estos pocos afortunados? (Al no haber ganado el Premio Nobel yo mismo, asumiré que se trata solo de suerte 😋).

# Seleccionamos los ganadores con 2 o más premios
nobel.groupby("full_name").filter(lambda x: x["full_name"].count() > 1)[["year","full_name","category"]]

yearfull_namecategory
191903Marie Curie, née SklodowskaPhysics
621911Marie Curie, née SklodowskaChemistry
891917Comité international de la Croix Rouge (Intern...Peace
2151944Comité international de la Croix Rouge (Intern...Peace
2781954Linus Carl PaulingChemistry
2831954Office of the United Nations High Commissioner...Peace
2981956John BardeenPhysics
3061958Frederick SangerChemistry
3401962Linus Carl PaulingPeace
3481963Comité international de la Croix Rouge (Intern...Peace
4241972John BardeenPhysics
5051980Frederick SangerChemistry
5231981Office of the United Nations High Commissioner...Peace

¿A qué edad obtienen el premio?

¡La lista de ganadores repetidos contiene algunos nombres ilustres! Nuevamente nos encontramos con Marie Curie, que obtuvo el premio en física por descubrir la radiación y en química por aislar el radio y el polonio. John Bardeen lo obtuvo dos veces en física por sus trabajos sobre transistores y superconductividad, Frederick Sanger lo obtuvo dos veces en química, y Linus Carl Pauling lo obtuvo primero en química y luego en paz por su trabajo en la promoción del desarme nuclear. También vemos que las organizaciones pueden obtener el premio, ya que tanto la Cruz Roja como el ACNUR lo han recibido más de una vez.

Pero, ¿cuántos años tienes generalmente cuando obtienes el premio?

# Convertimos birth_date de string a datetime
nobel["birth_date"] = pd.to_datetime(nobel["birth_date"])

# Calculamos la edad de los ganadores de Premio Nobel
nobel["age"] = nobel["year"] - nobel["birth_date"].dt.year

# Creamos gráfico con una regresión de tipo Lowess
sns.lmplot(x="year", y="age", data=nobel, lowess=True, aspect=2, line_kws={'color': 'green'}, height=7)

plt.show()

Diferencias de edad entre categorías

¡El gráfico de arriba nos muestra mucho! Vemos que al principio las personas solían tener alrededor de 55 años cuando recibían el premio, pero hoy en día el promedio está más cerca de los 65. Pero hay una gran dispersión en las edades de los galardonados, y aunque la mayoría tienen más de 50 años, algunos son muy jóvenes.

También vemos que la densidad de puntos es mucho más alta hoy en día que a principios del siglo XX: hoy en día se comparten muchos más premios, por lo que hay muchos más ganadores. También vemos que hubo una interrupción en los premios otorgados en torno a la Segunda Guerra Mundial (1939 - 1945).

Veamos las tendencias de edad dentro de las diferentes categorías de premios.

# Misma visualización que arriba, pero con gráficos separados para cada categoría
sns.lmplot(x="year", y="age", data=nobel, col="category", col_wrap=2, lowess=True, aspect=1.5, line_kws={'color': 'green'})

plt.show()

Los más jóvenes y más viejos

Vemos que los ganadores del premio de química, medicina y física han envejecido con el tiempo. La tendencia es más fuerte para física: la edad promedio solía ser inferior a 50 años, y ahora es de casi 70. Literatura y la economía son más estables. También vemos que economía es una categoría relativamente nueva. ¡Pero la categoría paz muestra una tendencia opuesta donde los ganadores son cada vez más jóvenes!

En la categoría de paz también tenemos a un ganador que parece excepcionalmente joven alrededor de 2010. Esto plantea las preguntas, ¿quiénes son las personas más viejas y más jóvenes que hayan ganado un Premio Nobel?

# El ganador más viejo del Premio Nobel (hasta 2016)
nobel.nlargest(1, "age")[["year","category","full_name", "age"]]

yearcategoryfull_nameage
7932007EconomicsLeonid Hurwicz90.0
# El ganador más joven del Premio Nobel (hasta 2016)
nobel.nsmallest(1, "age")[["year","category","full_name", "age"]]

yearcategoryfull_nameage
8852014PeaceMalala Yousafzai17.0

¡Orgullo nacional!

Argentina también cuenta con ganadores del Premio Nobel. Repasemos sus logros.

nobel[nobel["birth_country"] == "Argentina"][["year","category","full_name","birth_city","age"]]

yearcategoryfull_namebirth_cityage
1871936PeaceCarlos Saavedra LamasBuenos Aires58.0
2361947MedicineBernardo Alberto HoussayBuenos Aires60.0
5131980PeaceAdolfo Pérez EsquivelBuenos Aires49.0
5481984MedicineCésar MilsteinBahia Blanca57.0

Bueno, eso es todo por ahora. Espero que este post te haya resultado interesante y si tenés alguna consulta o sugerencia no dudes en contactarme al mail o seguirme en Twitter.

¡Hasta la próxima!


Este trabajo forma parte de los proyectos propuestos en la carrera Data Scientist with Python en Datacamp.

Martín Muelas
Martín Muelas
Data Analyst | BI Developer

Relacionado