Open INESEM
Investigación
Competitividad & Desarrollo (Perspectiva Descriptiva & De Correlación)
1. Introducción
En un mundo globalizado no podemos permanecer ajenos a la problemática derivada de las políticas económicas adoptadas por los países y que marcan el devenir de sus habitantes. Los diferentes planes de inversión condicionan los resultados a medio y largo plazo. La estructura económica determina la capacidad competitiva de las naciones y con ello su prosperidad.
A pesar de que existe abundante literatura al respecto, no se ha determinado con rotundidad que el crecimiento económico sea sinónimo de bienestar social aunque todo indica que están estrechamente relacionados. La renta per cápita podría tomarse como variable referente para explicar el desarrollo social y las diferentes condiciones de vida que ostentan unos ciudadanos frente a otros. En este contexto la productividad de una economía es un factor clave y el perfil de las inversiones cobra una importancia mayúscula.
Aquellos países que logren superar las barreras de los rendimientos decrecientes del capital conseguirán ventaja competitiva. Solo mediante el incremento de la calidad del mismo, pueden superarse dichas barreras. Tanto el capital humano como el capital físico, es decir, tecnología y conocimiento, guiarán a los países hacia el aumento de la productividad, la competitividad, el crecimiento económico y el bienestar social.
2. Metodología
- Descarga de módulos openpyxl y pandas para lectura de datos. Con openpyxl se puede ver un ejemplo en el archivo países_desarrollo_económico.py, en el que se crea un objeto lectura con openpyxl.load_workbook. Seguidamente se crean listas que llenan con loops for columna a columna. Con las listas se crean diccionarios y con ellos dataframe. Con pandas se leen los datos mediante pd.ExcelFile(). En el archivo gdp_base_2010.py hay un ejemplo. Se crea un dataframe con pd.ExcelFile() y se accede a la información de la hoja con parse.(). Se pueden apreciar otras operaciones como objeto.replace() para cambiar nombres con el propósito de homogeneizar listas e índices. Se borran columnas también con dataframe.drop(). En definitiva, se manipulan los dataframe con dataframe.set_index(), ...index.name, accediendo a las filas y columnas con .iloc[] y loc[], para modificar y borrar información en caso de no ser necesaria o reemplazar las celdas vacías con replace.([], np.nan).
- Se van leyendo los archivos y creando dataframes con cada uno de ellos. Creando un dataframe para cada variable además de otros adjuntos que contienen clasificaciones de países y de productos que se han considerado interesantes.
- Para que los países sean las mismos en cada uno de ellos se han cruzado listas con .isin(). También se han utilizado set() & set() para ver los elementos comunes. Para que los años coincidan se han borrado columnas o se han añadido otras.
- Los dataframe en bruto están en el archivo dataframes.py
- El siguiente paso ha sido estimar los datos NaN mediante interpolate(). Se ha hecho en modo linear y en ambas direcciones. En esta tarea se han utilizado las funciones isna(), sum() o dropna().
- Una vez en posesión de todos los dataframes, con los mismos países, los mismos periodos y sin missing data, se ha procedido a realizar la correlación mediante la función corr() cada variable independiente con la variable dependiente renta per cápita. En el archivo análisi.py se puede ver como se crea el dataframe corr_percap de correlaciones aglutinando las de cada variable con la función pd.concat().
- En los archivos plotting.py y plotting_2.py se ha importado el módulo matplotlib.pyplot para graficar accediendo al dataframe de correlaciones corr_percap creado en análisis.py. En plotting.py se grafica por cada país mediante una función mediante parámetro graf(z). El número del menú de cada país entra por z que es aplicado como z-1 para coincidir con los valores del índice que comienzan en 0. Seguidamente se utiliza un loop condicional para introducir datos en el dataframe con la condición de que otro dato se encuentre en otro dataframe, con in. Después se grafica creando los objetos de matplotlib; plt.figure y plt.subplots. Se aplican márgenes, leyendas, labels y demás como muestra el contenido. Los datos se han ordenado mediante sort_values() de mayor a menor o de menor (en la correlación lineal también es mayor) a mayor con los coeficientes negativos. En plotting_2.py se grafica por variables creando una función para cada una.
- Los archivos resultados.py muestran una serie de funciones que filtran la información con el propósito de desagregarla. Aparecen de nuevo loops condicionales para añadir información a los dataframes tanto con in como con booleanos. También la función sort_values(), filtros de valores negativos y positivos, es decir, se divide el dataframe en otros dos. Uno de coeficientes negativos y otros positivos. Se sacan los valores máximos y mínimos con max() y min(). Sus índices con idxmax() e idxmin(). Se redondean con round(4) a cuatro decimales. Se muestran en pantalla con print(' ... '.format()). Etc...
2.1 Guía de navegación:
- Entrar en el archivo COMPETITIVIDAD_DESARROLLO.py y pulsar F5.
- En el menú dataframes, para visualizar el 3.2.1., introducir 3.2.1 sin el último punto. El 4.1. pulsar 4.1 y el 5., 5 por ejemplo. En este archivo encontrará los dataframe en bruto que se han utilizado para configurar las variables y otros con información relevante.
- En el apartado 2, Análisis por países se encuentran todas las naciones graficadas y se puede observar la incidencia de las distintas variables en cada uno de ellos.
- En el apartado 3, Análisis por variables se hace lo propio pero por cada variable de la muestra.
- En el apartado 4 se despliegan las listas de coeficientes ordenados de mayor a menor.
- En el número 5 se hace una clasificación del coeficiente en 4 tramos: relevante (1/0.75), moderado (0.749/0.5), leve (0.49/0.25) e irrelevante (0.25/0). Se obtienen para cada uno de ellos el número y el tipo de países según su estatus económico así como otros apuntes. Todo ello cruzando los distintos dataframes.
3. Resultados
En total son 13 variables independientes que se han correlacionado con una variable dependiente, la renta per cápita con base en 2010. El objetivo es calcular su relación lineal por lo que se ha optado por el Coeficiente de Correlación de Pearson.
Las variables seleccionadas reflejan diversos perfiles productivos y se han agrupado por:
- Especialización comercial y 'reindustrialización':
- Exportaciones de manufacturas según nivel tecnológico incorporado: manufacturas tecnología baja, media-baja, media-alta y alta
- Empleo en el sector industrial como porcentaje del empleo total: empleo industria
- Exportaciones de bienes y servicios TIC
- Capital tecnológico:
- Gasto estatal en I+D como porcentaje del PIB
- Porcentaje de investigadores en I+D por millón de habitantes
- Capital humano:
- Gasto en educación superior
- Gasto estatal total en educación
- Ratio estudiantes/profesor
- Dependencia energética:
- Importación de energía como porcentaje de su uso
El censo de países ha sido obtenido del UNCTAD después de cruzarlos con el índice del World Bank. Un total de 77 forman parte de la muestra:
Países Desarrollados 31 (57% del total): 'Austria', 'Belgium', 'Bulgaria', 'Canada', 'Croatia', 'Cyprus', 'Denmark', 'Estonia', 'Finland', 'France', 'Germany', 'Greece', 'Hungary', 'Iceland', 'Ireland', 'Italy', 'Latvia', 'Lithuania', 'Luxembourg', 'Malta', 'Netherlands', 'New Zealand', 'Norway','Poland', 'Portugal', 'Romania', 'Slovenia', 'Spain', 'Sweden', 'United Kingdom', 'United States of America'.
Países en Transición 6 (30% del total): 'Albania', 'Georgia', 'Kazakhstan', 'Russian Federation', 'Serbia', 'Ukraine'.
Países en Desarrollo 40 (22% del total): 'Argentina', 'Bahrain', 'Botswana', 'Brazil', 'Brunei Darussalam', 'Cambodia', 'Chile', 'China', 'Colombia', 'Ecuador', 'El Salvador', 'Ethiopia', 'Ghana', 'Guatemala', 'Honduras', 'India', 'Indonesia', 'Jordan', 'Kenya', 'Kuwait', 'Malaysia', 'Mauritius', 'Mexico', 'Morocco', 'Mozambique', 'Myanmar', 'Namibia', 'Nepal', 'Oman', 'Pakistan', 'Panama', 'Philippines', 'Senegal', 'Singapore', 'Sri Lanka', 'Thailand', 'Togo', 'Tunisia', 'Turkey', 'Uruguay'.
Por motivos de eficiencia nos centramos en los coeficientes clasificados como relevantes (1/0.75) y en su tramo positivo ya que el negativo, aunque contiene algunos valores, está más alejado del objetivo del presente trabajo que los primeros. Aplicando funciones como describe(), median() o mode(), los resultados de las variables en el susodicho tramo son los siguientes:
3.1 Exportaciones de manufacturas con baja tecnología incorporada
Nº Países: 46 (60% de la muestra)
Desarrollados: 18 (58% de su clase)
Transición: 3 (50% de su clase)
En Desarrollo: 25 (62% de su clase)
Máximo = 0.9835 (Camboya)
Mínimo = 0.7531 (Brasil)
25% = 0.861248
50% = 0.918240
75% = 0.958210
Media = 0.9042
Mediana = 0.9182
Moda = 0
Desviación Típica = 0.0642
La mediana se encuentra entre las posiciones 22/23 de la lista ordenada de países. La desviación típica indica poca dispersión por lo que la media refleja el centro de gravedad de la distribución con bastante exactitud. Moda igual a cero significa que no se repite ningún valor. Los resultados de los percentiles junto con los máximos y los mínimos confirman también una distribución bastante uniforme por lo que la media aritmética es representativa.
Todas las variables que siguen presentan un perfil similar al anterior y por lo tanto poseen una distribución uniforme y una media aritmética representativa.
3.2 Exportaciones de manufacturas con media-baja tecnología incorporada
Nº Países: 51 (66% de la muestra)
Desarrollados: 20 (65% de su clase)
Transición: 4 (66'6% de su clase)
En Desarrollo: 27 (67'5% de su clase)
Máximo = 0.983 (Guatemala)
Mínimo = 0.7565 (Croacia)
25% = 0.8495
50% = 0.8844
75% = 0.9213
Media = 0.8797
Mediana = 0.8844
Moda = 0
Desviación Típica = 0.0569
3.3 Exportaciones manufacturas con tecnología media-alta incorporada
Nº Países: 60 (78% de la muestra)
Desarrollados: 25 (80% de su clase)
Transición: 3 (50% de su clase)
En Desarrollo: 32 (80% de su clase)
Máximo = 0.9915 (El Salvador)
Mínimo = 0.7635 (Albania)
25% = 0.861463
50% = 0.9070
75% = 0.9511
Media = 0.8976
Mediana = 0.9070
Moda = 0
Desviación Típica = 0.0649
3.4 Exportaciones manufacturas con alta tecnología incorporada
Nº Países: 53 (68% de la muestra)
Desarrollados: 22 (71% de su clase)
Transición: 3 (50% de su clase)
En Desarrollo: 1 (2'5% de su clase)
Máximo = 0.9777 (Poland)
Mínimo = 0.7635 (Jordan)
25% = 0.8717
50% = 0.9031
75% = 0.9444
Media = 0.8992
Mediana = 0.9031
Moda = 0
Desviación Típica = 0.0536
3.5 Exportaciones de bienes sector TIC
Nº Países: 5 (6'5% de la muestra)
Desarrollados: 3 (9'6% de su clase)
Transición: 0 (0% de su clase)
En Desarrollo: 2 (5% de su clase)
Máximo = 0.9351 (Bulgaria)
Mínimo = 0.7768 (El Salvador)
25% = 0.8076
50% = 0.8564
75% = 0.8923
Media = 0.8536
Mediana = 0.8564
Moda = 0
Desviación Típica = 0.0635
3.6 Gasto gubernamental en I+D
Nº Países: 30 (39% de la muestra)
Desarrollados: 10 (9'6% de su clase)
Transición: 1 (16'6% de su clase)
En Desarrollo: 19 (47'5% de su clase)
Máximo = 0.9823 (Cambodia)
Mínimo = 0.7538 (United States of America)
25% = 0.8185
50% = 0.8709
75% = 0.9317
Media = 0.8715
Mediana = 0.8709
Moda = 0
Desviación Típica = 0.0661
3.7 Investigadores en I+D por millón de habitantes
Nº Países: 46 (60% de la muestra)
Desarrollados: 18 (58% de su clase)
Transición: 3 (50% de su clase)
En Desarrollo: 25 (62.5% de su clase)
Máximo = 0.9835 (Cambodia)
Mínimo = 0.7531 (Brazil)
25% = 0.8383
50% = 0.8963
75% = 0.9349
Media = 0.8861
Mediana = 0.8963
Moda = 0
Desviación Típica = 0.0635
3.8 Exportaciones de servicios sector TIC
Nº Países: 5 (6'5% de la muestra)
Desarrollados: 3 (9'6% de su clase)
Transición: 0 (0% de su clase)
En Desarrollo: 2 (5% de su clase)
Máximo = 0.9351 (Bulgaria)
Mínimo = 0.7768 (El Salvador)
25% = 0.8076
50% = 0.8564
75% = 0.8923
Media = 0.8536
Mediana = 0.8564
Moda = 0
Desviación Típica = 0.0635
3.9 Gasto gubernamental en educación superior
Nº Países: 4 (60% de la muestra)
Desarrollados: 0 (0% de su clase)
Transición: 2 (33'3% de su clase)
En Desarrollo: 2 (5% de su clase)
Máximo = 0.969 (Uruguay)
Mínimo = 0.7896 (Myanmar)
25% = 0.7964
50% = 0.8395
75% = 0.9025
Media = 0.8594
Mediana = 0.8395
Moda = 0
Desviación Típica = 0.0836
3.10 Gasto gubernamental en educación
Nº Países: 19 (%24'6 de la muestra)
Desarrollados: 2 (33'3% de su clase)
Transición: 10 (33'3% de su clase)
En Desarrollo: 10 (25% de su clase)
Máximo = 0.9879 ( Belgium)
Mínimo = 0.7605 (Honduras)
25% = 0.8156
50% = 0.8645
75% = 0.9184
Media = 0.8658
Mediana = 0.8645
Moda = 0
Desviación Típica = 0.0686
3.11 Ratio estudiantes/profesor
Nº Países: 14 (%18'18 de la muestra)
Desarrollados: 4 (13% de su clase)
Transición: 0 (0% de su clase)
En Desarrollo: 10 (25% de su clase)
Máximo = 0.9561 (Nepal)
Mínimo = 0.7656 (Sweden)
25% = 0.8360
50% = 0.8691
75% = 0.9230
Media = 0.8721
Mediana = 0.8691
Moda = 0
Desviación Típica = 0.0599
3.12 Importaciones energía sobre el total de su uso
Nº Países: 19 (24'6% de la muestra)
Desarrollados: 3 (9'6% de su clase)
Transición: 0 (0% de su clase)
En Desarrollo: 16 (40% de su clase)
Máximo = 0.9699 ( India)
Mínimo = 0.7829 ( Morocco)
25% = 0.8363
50% = 0.8695
75% = 0.9292
Media = 0.8813
Mediana = 0.8695
Moda = 0
Desviación Típica = 0.0574
3.13 Empleo sector industrial sobre el empleo total
Nº Países: 15 (19'4% de la muestra)
Desarrollados: 0 (0% de su clase)
Transición: 1 (16'6% de su clase)
En Desarrollo: 14 (35% de su clase)
Máximo = 0.9832 (Cambodia)
Mínimo = 0.7694 (Georgia)
25% = 0.8800
50% = 0.917146
75% = 0.961536
Media = 0.9113
Mediana = 0.9171
Moda = 0
Desviación Típica = 0.0653
4. Conclusiones
Aunque en un principio pueda parecer chocante, las variables relacionadas con las TIC no indican una estrecha relación ya que el número de países es notablemente inferior. Las razones probablemente se encuentren en el menor valor añadido, menores barreras de entrada, en la dimensión empresarial y en las economías de escala en estos sectores. Los servicios tienden normalmente a tener menores valores en estas variables y aunque estén relacionados con las nuevas tecnologías, no es extraño que su relación con la renta per cápita no sea fuerte.
- Países Desarrollados: 60%
- Países en Transición: 0%
- Países en Desarrollo: 40%
El gasto público en educación superior depende de la eficiencia y de a qué campos estén orientados los estudios. Puede que la gestión no sea eficiente y que existan problemas de sobreeducación (como en España).
- Países Desarrollados: 0%
- Países en Transición: 50%
- Países en Desarrollo: 50%
El gasto público total en educación sigue el mismo patrón que la variable anterior y puede ser explicada de la misma forma.
- Países Desarrollados: 36'8%
- Países en Transición: 10'5%
- Países en Desarrollo: 52'6%
El ratio estudiantes/profesor demuestra que la cantidad no es sinónimo de calidad. Habría que estudiar en más profundidad la gestión de cada países en particular.
- Países Desarrollados: 28'5%
- Países en Transición: 0%
- Países en Desarrollo: 71'5%
Las dos siguientes variables se ven claramente afectados por su heterogeneidad:
La dependencia energética resta productividad y aunque en principio debe tener una clara correlación negativa, la muestra no aclara una correlación sólida ni negativa ni positiva. Habría que profundizar en los sectores energéticos de cada país para afinar más el análisis. Gas, petróleo, carbón, etc....
- Países Desarrollados: 15'7%
- Países en Transición: 0%
- Países en Desarrollo: 84%
El comportamiento del empleo industrial sobre el total también es desconcertante porque a priori debería tener una clara correlación positiva. Sus pobres resultados invitan a desagregar los subsectores industriales y a seleccionar un mayor número de países así como a recurrir a fuentes de datos alternativas.
- Países en Transición: 0%
- Países en Transición: 6'6%
- Países en Desarrollo: 93'3%
Sí destaca el número de investigadores en i+d por millón de habitantes. Su distribución sigue un patrón muy similar al de las manufacturas, como veremos más adelante, en cuanto a participación de países:
- Países Desarrollados: 40%
- Países en Transición: 6%
- Países en Desarrollo: 54%
La investigación en i+d está íntimamente ligada a los procesos de producción. Los investigadores innovan y los procesos mejoran en eficiencia y productividad. El modelo indica que existe correlación positiva.
A continuación el gasto estatal en i+d muestra una distribución algo distinta en la que los países desarrollados tienen menos peso:
- Países Desarrollados: 33%
- Países en Transición: 3'3%
- Países en Desarrollo: 63%
Esta diferencia es probable que se deba a los distintos sistemas de innovación. En los países desarrollados puede que el gasto privado sea mayor y que el gasto público además de ser menor no sea tan eficiente. La correlación es positiva según el modelo.
En cuanto a las manufacturas, a la vista de los resultados es apreciable la clara correlación positiva que existe entre las manufacturas y la renta per cápita. En los cuatro grupos los países de la muestra siguen el mismo patrón distributivo. Aproximadamente sus porcentajes son:
- Países Desarrollados : 42%
- Países en Transición: 5%
- Países en Desarrollo: 53%
Por lo tanto parece un fenómeno transversal. Sus explicaciones deben estar en el valor añadido de su actividad, la dimensión empresarial y el aprovechamiento de las economías de escala comparados al sector servicios por ejemplo. La sólida participación de los países desarrollados indica una reindustrialización en sectores de alta tecnología tras unas décadas de sectores terciarios sobredimensionados.
En resumen, según el presente análisis:
CORRELACIÓN RELEVANTE + |
CORRELACIÓN NO RELEVANTE + |
INVESTIGADORES EN I+D / MILLÓN HABT. GASTO PÚBLICO EN I+D EXP. MANUFACTURAS TECNOLOGÍA: BAJA, MEDIA-BAJA, MEDIA-ALTA Y ALTA |
EXPORTACIONES BIENES Y SERVICIOS TIC GASTO PÚBLICO EN EDUCACIÓN SUPERIOR GASTO PÚBLICO TOTAL EN EDUCACIÓN RATIO ESTUDIANTES/PROFESOR IMPORTACIONES ENERGÍA EMPLEO SECTOR INDUSTRIAL |
En el siguiente gráfico se ilustran la media aritmética de los coeficientes en el tramo relevante para cada variable así como el número de países que están dentro del mismo.
Para finalizar recalcar que la correlación obtenida es lineal, no de otro tipo, y ausencia de la misma no excluye la existencia de otra distinta. Por lo tanto, el trabajo llega a su fin en lo que es un punto y aparte hacia nuevas investigaciones.
Referencias
Introducción a la Programación Estadística. (2016). Rafael Marín Sastre. Máster en Business Intelligence & Big Data. INESEM Business School.
Conferencia de las Naciones Unidas sobre Comercio y desarrollo. (12 de mayo de 2019). https://unctad.org/en/Pages/statistics.aspx
Banco Mundial. (15 de Mayo de 2019). https://datos.bancomundial.org/