Archivo de la categoría: Investigación

La toma de datos de tráfico: pasado, presente y futuro

El conocimiento del tráfico y sus previsiones es una herramienta básica para la planificación, proyecto, conservación y explotación de la red de transportes. De una forma sintética podemos distinguir los siguientes usos de los datos de tráfico:

1. Planificación intermodal. Análisis del diseño e inversiones en los distintos modos.

2. Planificación modal. Análisis y evaluación de las necesidades de actuaciones en cada tramo de red.

3. Proyecto de una carretera. Dimensionamiento de la sección y dimensionamiento de firmes.

4. Conservación y Explotación. Actuaciones en función de la magnitud y distribución del tráfico.

5. Estudio financiero y de rentabilidad económica y social.

6. Previsiones del tráfico futuro en una vía.

7. Programas de Seguridad vial. Accidentalidad, mercancías peligrosas, velocidad, tráfico,…

8. Previsiones Macroeconómicas.

9. Coordinación entre Administraciones Públicas. Inversiones según necesidades, ingresos según tráfico y consumos de combustibles,…

Por ello, con motivo del Plan de Carreteras de 1960 se iniciaron en España de una forma sistemática y para el conjunto de la red los estudios de oferta (inventario) y demanda (tráfico). Como resumen del trabajo de recopilación de los datos de aforo de tráfico, se publican anualmente el Mapa de Tráfico de la Dirección General de Carreteras y el DVD con el sistema de información geográfica asociado.

La toma de datos de tráfico: pasado, presente y futuroEl Big Data, una nueva oportunidad para el aforo de datos de tráfico

Hasta ahora, los datos de tráfico obtenidos de los aforos era muy básicos: cantidad de vehículos que atraviesan una sección de la carretera y su velocidad. Sin embargo, la penetración de los Smartphone y el Internet de las Cosas aplicado a la industria de la automoción, permitirán pronto obtener multitud de datos que, analizados convenientemente a través del paradigma Big Data, proporcionarán una valiosa información del tráfico, mucho más completa que hasta ahora, fomentando de este modo una toma de decisiones de planificación más informada y rigurosa.

La toma de datos de tráfico: pasado, presente y futuro

Algunos datos que podremos obtener son los siguientes:

1. Los itinerarios completos desde origen a destino de todos los usuarios de la vía, así como los patrones de repetición de esos itinerarios.

2. La velocidad de circulación en cada momento, algo muy útil para controlar infracciones por exceso de velocidad.

3. El perfil de caracterización de los usuarios. En este caso, es muy importante garantizar la privacidad de los usuarios.

4. Los consumos de los vehículos, así como su estado de mantenimiento.

5. Los lugares de parada en itinerarios urbanos e interurbanos.

6. Los lugares en los que se producen atascos y los motivos por los que se producen, en tiempo real.

7. El número de ocupantes en cada vehículo.

8. La fiscalización de infracciones como apoyo a la seguridad vial.

Ante este nuevo escenario, cabe esperar una importante mejora en la calidad de los diagnósticos de los problemas planteados y, por tanto, una mayor capacidad de planificación. Y, ¿por qué no? También la adaptación de las infraestructuras para hacer frente a los nuevos paradigmas de movilidad que están por llegar.


¿Quieres profundizar en tu conocimiento sobre estos temas? Consulta el Master Internacional en Tráfico, Transportes y Seguridad Vial (Título Propio UDIMA) en el que imparto clase.

Nota: la imagen principal está tomada de motorpasion.com


Recordad: para no perderos nada, podéis uniros a nuestro canal de Telegram para recibir contenidos interesantes tanto del blog como de otros lugares: https://telegram.me/urbanismoytransporte

¿Cómo elegir dónde publicar un paper (artículo científico)?

Algo que prometí es que escribiría de vez en  cuando de cuestiones relacionadas con el periodo doctoral. Actualmente, uno de los requisitos indispensables en muchos programas de doctorado es haber publicado uno o varios artículos científicos (llamados comúnmente «papers», por su nombre en inglés). Pero algo también muy habitual es que nadie te explique cómo saber dónde publicar tu trabajo. Y no es baladí porque cada revista tiene su scope y sus requisitos editoriales, por lo que es bueno seleccionar un par de revistas antes de empezar a escribir el paper.

Voy a intentar resolveros parcialmente las dudas. Y digo parcialmente porque, cuando te pones a mirar dónde publicar o te rechazan un paper y te toca mirar una segunda revista donde enviarlo, siempre surgen inconvenientes. Pero bueno, al menos que sirva de linterna para alumbrar los primeros pasos de la elección:

Lo primero que hay que hacer es ver dónde puede encajar tu investigación. Para ver las categorías existentes hay que entrar en esta web: http://admin-apps.webofknowledge.com/JCR/JCR. Si estás en una red universitaria o de un centro de investigación, entrarás sin problemas. Si estás en casa, es necesario emplear una VPN. Así pues, hago un inciso para los estudiantes de la Universidad Politécnica de Madrid (más que nada porque es en la que me lo bajé yo y no tengo acceso en otras universidades).


Hay que entrar en la Politécnica Virtual y abrir tu sesión como alumno.

Vas a la pestaña «Utilidades» y a la izquierda pinchas en informática. Ahí te encuentras «Servicios en red – acceso VPN»:

¿Cómo elegir dónde publicar un paper (artículo científico)?

Dentro, pinchas en «Servicio VPN-IPSec» y te sale esto:
¿Cómo elegir dónde publicar un paper (artículo científico)?


Según tu ordenador sea de 32 o de 64 bits, bajas el ejecutable correspondiente (si es reciente y dudas, lo normal es que sea de 64) y lo instalas. Después, te conectas a la red como una más de todas las que tendrás disponibles entre wifis y demás. Si no te sale entre las disponibles, tienes que acceder desde el «Centro de redes» de tu pc.


***** Una adventencia: es probable que entres a hacer lo que voy a describir a continuación y veas factores de impacto de las revistas diferentes a los que hay en las imágenes que he puesto. Es porque estas imágenes están recicladas de cuando le expliqué esto mismo a una compañera que estaba empezando el doctorado hace ahora unos dos años.

Una vez dentro de la Web of Knowledge, la búsqueda la haremos del siguiente modo: View a group of journals by (y seleccionas Subject Category).

¿Cómo elegir dónde publicar un paper (artículo científico)?
Al entrar, te salen todos los topics.  Seleccionas, por ejemplo, Transportation Science & Technology.
¿Cómo elegir dónde publicar un paper (artículo científico)?
Ahora te salen todas las revistas de transportes que son JCR.
¿Cómo elegir dónde publicar un paper (artículo científico)?
Pinchando en una de ellas, tienes toda la información necesaria sobre la revista.
¿Cómo elegir dónde publicar un paper (artículo científico)?
Para saber «cómo es de buena» te tienes que fijar en su factor de impacto, aunque lo que te da realmente la información es el cuartil al que pertenece. Eso lo ves pinchando en Journal Ranking.
¿Cómo elegir dónde publicar un paper (artículo científico)?

Hay revistas que entran en una sola categoría (en este caso Transportation Science & Technology), pero hay otras que entran en varias. A veces una revista pertenece a cuartiles diferentes en cada una. Ten cuidado con eso, que puede traicionar (eso sí, el factor de impacto será el mismo).

A partir de este punto, cuando una revista te interese, métete en su web y mira: 1) que tu trabajo entre en el scope de la revista (es bastante ingrato que, tras meses de espera, el editor te diga que ni siquiera te revisan el paper porque no se ajusta a la revista); 2) artículos que estén en abierto para comparar y tomarlos de referencia por ejemplo para el estilo de citación de las referencias (aunque yo soy partidario del uso de gestores bibliográficos y creo que lo más valioso que dejé de mi periodo en TRANSyT fue enseñar a los doctorandos que venían detrás las bondades de Mendeley. Si un día me veo con ganas de aburriros, monto un post sobre el tema); 3) las pautas editoriales (suele poner algo parecido a «Information for authors») y 4) los documentos que hay que enviar en la «submission» (sobre todo si van a pedirte una lista de potenciales revisores, porque te tocará prepararla con anterioridad al envío y lleva tiempo pensarla). 

Dos consejos a este respecto: 1) revisa si en la web dicen sobre el tiempo medio de revisión o míralo en la Title Page de los papers en abierto comparando las fechas de envío y publicación. Para la Tesis, un factor fundamental es el plazo de respuesta porque si es una revista en la que tardan mucho, puede llegar a suponer que tengas que posponer la defensa de tu Tesis; 2) procura buscar referencias bibliográficas que los key researchers de tu tema hayan publicado en esa misma revista o en revistas del mismo grupo editorial. No es obligatorio, pero tener al editor de tu lado en un empate entre referees (por ejemplo un «rejection» vs. un «minor revisions») es importante.

Y un comentario surgido de la experiencia: hay quien centra su estrategia en publicar sólo en revistas Q1 y otra gente que va a por la Q4 pensando que es más fácil publicar en ellas. La realidad es que depende de la revista y de la suerte que tengas con los revisores.

Y una vez que publiques, no olvides compartir tu trabajo porque el conocimiento es mejor cuanto más libre resulta:

¿Cómo elegir dónde publicar un paper (artículo científico)?
(Sirva esta imagen para recomendaros las tiras de PHD Comics)

Técnicas utilizadas en la planificación (2). El estimador diff-in-diff

La UE nos sorprendió a todos la semana pasada con una noticia malísima: va a permitir a los fabricantes que los coches contaminen más. No debía cumplir las normas ninguno de los ellos, pero la solución alcanzada, lejos de castigarles por no cumplir una normativa comunitaria ya asentada, da vía libre a la piratería y sienta un triste precedente que dice mucho y no precisamente bueno de la UE. Y es que, cuando por fin parecía haber calado el mensaje de que las Administraciones Públicas deben velar por un reparto modal, tanto de pasajeros como de mercancías, que prime el uso de los modos de transporte más respetuosos con el medio ambiente por la evidente relación entre los índices de contaminación y determinados problemas que afectan a la salud pública, va la UE y tira por tierra décadas de esfuerzos. Ahora parece que la solución sólo podrá pasar por una fiscalidad menos permisiva con el consumo de combustibles fósiles. Pero esta solución no es una buena medida, pues transmite todos los costes a los usuarios cuando gran parte de la culpa es de los fabricantes…

Aunque tampoco hace falta irse a Bruselas para observar este tira y afloja entre el aprecio al coche a cualquier precio y el respeto a la salud pública. Lo tenemos bien cerca: mientras el ayuntamiento de Madrid se ha fijado el objetivo de reducir los niveles de contaminación, algún alcalde vecino se ha despistado un poco aludiendo a la Constitución como garante para poder conducir cuando y como sea:

Y, es que, el derecho de los alcorconeros queda garantizado por las alternativas de transporte público y porque, en el supuesto de que se alcanzara el escenario 4 (algo muy poco probable), podrían seguir circulando las motos (no me parece algo positivo, pero han quedado fuera del nuevo protocolo), los vehículos de reparto, los taxis y los coches eléctricos. Pero, es que, aunque no fuera así, ¿debería primar el derecho individual a ir en coche por encima del derecho común a la salud?

En este escenario, eldiario.es publicó el siguiente artículo: «Los picos de contaminación causan un aumento radical en los ingresos hospitalarios». En él se comparan los registros de “ingresos hospitalarios” y “concentración de NO2» y se concluye que existe relación entre estas dos variables. Pero vamos a analizar cómo podría concluirse de forma algo más adecuada esta cuestión.

Técnicas utilizadas en la planificación (2). El estimador diff-in-diff

A la vista del gráfico que se presentaba en el artículo, hay dos detalles a comentar. El primero es que a los autores del mismo les debieron enseñar una formulación diferente que la que me enseñaron a mí porque le ponen el 2 al dióxido de nitrógeno como superíndice en lugar de como subíndice. El segundo es más puñetero: la correlación no implica causalidad. Es condición necesaria, pero no suficiente (y con cuidado, porque puede ser correlación negativa, no siempre positiva). Y es aquí donde quería llegar para explicar el uso del estimador diff-in-diff.

Técnicas utilizadas en la planificación (2). El estimador diff-in-diff
La imagen original es de https://xkcd.com/552. Sobre la traducción no ha sido posible esclarecerlo porque está por todos lados.

Pero antes me voy a parar a analizar cuán correlacionadas están las dos muestras, porque aunque en el artículo se dé por supuesta, no lo tengo tan claro. Al carecer de datos numéricos, sólo queda la descripción pura y dura: el número de ingresos hospitalarios parece seguir una periodicidad bastante marcada y tener una media más o menos homogénea y cierta homocedasticidad; esto no pasa con la muestra de concentración de NO2 (por cierto, sin unidades en el gráfico y las unidades son importantes cuando se estudia la correlación. Se suele medir en µg/m3 pero, dado que la superación en el protocolo es de 400 µg/m3 y la escala del gráfico termina en 80, no alcanzo a adivinar las unidades empleadas), que presenta una recurrencia que no puede llegarse a considerar periodicidad, una media que se reduce paulatinamente en el periodo 2006-2013 (ojo, que 2014 parece invertir la tendencia) y una varianza cambiante. Así que, aunque “bailen juntas” en su variación temporal, con una cadencia similar, estas curvas no demuestran tener una correlación fuerte. En todo caso, puede hablarse de coocurrencia, eso es innegable.

Pero supongamos que sí estuvieran correlacionadas, ¿significaría esto que la concentración de NO2 es la causa de los ingresos hospitalarios? Rotundamente, no. Y lo demuestro con un contraejemplo: el consumo de mozzarella está fuertemente correlacionado con el número de doctorados en ingeniería civil y sin embargo… 

Técnicas utilizadas en la planificación (2). El estimador diff-in-diff
(pinchad en la imagen, que hay algunas correlaciones muy chulas)

… al menos en mi caso, no debe estar motivado por mi consumo de mozzarella porque, aunque el queso en general me encanta, la mozzarella apenas la como. Así que, quizá se trate de una casualidad. Quizá…

El estimador diff-in-diff

En términos generales, es prácticamente imposible demostrar a ciencia cierta la causalidad, pero hay técnicas que la aproximan. Una de ellas consiste en emplear el estimador diff-in-diff (difference in differences). Este estimador, muy empleado en econometría, mide el efecto de aplicar un tratamiento en un determinado periodo de tiempo y compararlo con la tendencia esperada (se distinguen así los grupos de tratamiento y de control). Pero cuidado: la confirmación de causalidad no implica que sea la única causa y a veces varias causas no explican todos los efectos si no tenemos en cuenta las sinergias (correlaciones entre las causas).

El método de aplicación del estimador diff-in-diff consiste simplemente en sacar diferencias (restas), primero en dos momentos distintos para cada individuo y luego entre el promedio del grupo tratamiento y el del grupo control. Esta aplicación puede realizarse como un test de diferencia de medias entre estos dos grupos de observaciones o puede implementarese a través de una regresión econométrica. Sin entrar en el aparato matemático que sustenta el método (si lo queréis ver, lo tenéis por ejemplo, en estas referencias: enlace 1, enlace 2), lo que se evalúa es si la variable dependiente presenta variaciones significativas en el grupo de tratamiento respecto al grupo de control que sean atribuibles a las diferencias introducidas en la variable independiente. Esto se suele estudiar a través de tres métricas: 1) endogeneidad, 2) correlación intragrupo y 3) autocorrelación. Si hay diferencias entre ambos grupos antes y después de la aplicación de la medida de diferenciación, la variable dependiente será consecuencia de la variable independiente (en realidad, en estadística todo es siempre más tibio y se dice que no parece que sean independientes, pero no se habla tal cual de causa y consecuencia). De este modo, un caso de causalidad es algo tal que así:

Técnicas utilizadas en la planificación (2). El estimador diff-in-diff
La imagen está sacada de aquí: http://www.advancedepidemiology.org/difference-in-difference-estimation/

Al no tener los datos numéricos, no puedo decir si efectivamente hay causalidad en el ejemplo presentado, sólo que la forma más sencilla de demostrarla es con el operador diff-indiff. Eso sí, aunque dudo de la metodología empleada no dudo de las conclusiones, a la vista de tantos estudios (enlace 1, en castellano; enlace 2, en inglés). Ahora sólo cabe esperar que la UE y el alcalde de Alcorcón recuperen la cordura.


Nota:

Hay un «pero» en este planteamiento y, aunque lo he apuntado, prefiero repetirlo para dejarlo claro porque no es baladí: normalmente las consecuencias no tienen una causa única sino un cóctel de causas y evaluar la fortaleza de cada una no se puede medir con sencillez con el estimador diff-in-diff. Y para ello suele ser más apropiado ir hacia análisis factorial, estadística inferencial o técnicas de minería de datos/inteligencia artificial, como las Redes Bayesianas. Quizá me anime y la próxima técnica de esta serie sean las Redes Bayesianas, pero no lo prometo porque la verdad es que he terminado un poco harto de ellas por la Tesis.


Actualización:

Me pasan por Twitter dos estudios sobre el tema que emplean diseño experimental, que es una técnica estadística que consiste en usar varios grupos y comparar sus comportamientos antes la manipulación de una o varias variables. Como veis, lo mismo que diff-in-diff, pero desde la perspectiva médica en lugar de desde la perspectiva econométrica. Los podéis leer en [enlace 1] y [enlace 2].

How should the sustainability of the location of dry ports be measured?

Como ya comenté, la semana pasada estuve por Frankfurt en la European Transport Conference 2015. La verdad es que la experiencia estuvo bastante bien y no sólo expuse una ponencia sino que además trabajé uno de los días en la organización. En los 4 días que pasé en Frankfurt visité toda la ciudad y ya daré buena cuenta en un artículo específico sobre el transporte en esta ciudad. Mientras tanto, os dejo con la que fue mi ponencia en el congreso:

Y os dejo mi «discurso» diapositiva a diapositiva:

Slide 1: 

Good afternoon everyone. First of all, I want to thank the audience for attending this session in which I will present this research, based on my Doctoral Dissertation. I also want to apologize in advance for any errors that I may commit for two reasons: the nerves caused by the presentation; and the use of a language that isn’t my mother tongue.

So, let’s look at the question of “HOW THE SUSTAINABILITY OF THE LOCATION OF DRY PORTS SHOULD BE MEASURED”.

Slide 2: 

I’m Samir Awad Núñez and I come from Madrid. I have a MSc in Civil Engineering and I’m currently finishing my doctoral research. I hope to obtain my doctorate in late 2015 or early 2016.

There are three other members of the research team: my Thesis Directors Dr. Nicoletta González Cancelas and Dr. Alberto Camarero Orive and my collaborator in the development of the mathematical aspects of the research, Dr. Francisco Soler Flores.

Slide 3: 

Well,

The global economic structure has two main properties. First: centers of production and consumption are decentralized. Second: companies tend to minimize their stock. This has led to a change from push manufacturing to pull manufacturing. In addition, consumption patterns have encouraged a very short production cycle,  leading to “just in time” production.

The consequent increase in freight traffic all over the world creates considerable problems and challenges for the freight transport sector. This situation has led shipping to become the most suitable and cheapest way to transport goods all around the world. And ports are now configured as nodes with critical importance in the logistics supply chain as a link between two transport systems, sea and land.

Slide 4: 

Increase in activity at seaports is producing three undesirable effects. First: increasing congestion in port operations and road routes serving terminals. Second: lack of open space in port areas. And, finally, a significant environmental impact on the coast. These adverse effects can be mitigated by moving part of the activity inland.

Slide 5: 

Implementation of dry ports is a possible solution to these problems and would also provide an opportunity to strengthen intermodal solutions as part of an integrated and more sustainable transport chain, acting as a link between road and railway networks. In this sense, implementation of dry ports allows the separation of the links of the transport chain, thus facilitating the shortest possible routes for the lowest capacity and most polluting means of transport.

Furthermore they have some advantages compared with other types of logistics terminals: 1) dry ports are connected with seaports by railway. And there is widespread consensus that railroad is the land transport mode with lowest external costs and least harmful effect on the environment, so they promote a more sustainable supply chain; 2) Because they allow customs clearance and other complementary activities outside seaports, they speed up the transit of goods through seaports and reduce the pressure on this link in the supply chain; 3) They extend the hinterland of the ports inland.

However, the decision of where to locate a dry port must also ensure the sustainability of the site. On this point, we must ask some questions: 1) What set of variables should we use? 2) What relationships exist between these variables? 3) How do we measure the sustainability of the location of dry ports?

Slide 6: 

Thus, the main objective of this work is to understand the variables influencing the sustainability of dry port location and how this sustainability can be evaluated.

In order to achieve this objective, we identified the following tasks as being necessary:

1)Identify the set of variables.

2)Build a database of relevant geographic information.

3)Identify the existing relationships between the variables.

4) Establish a methodology to measure and compare the sustainability of each location.

Slide 7: 

This is the complete methodology diagram. But rather than comment on the detail now, we will look at each step in turn during the rest of the presentation.

Slide 8: 

The first task is to set the framework, and consists of two parts: first, identifying the set of factors influencing the quality of the location of dry ports and variables on which they depend; and, second, collecting geographic information. For each variable we obtained a value for each dry port, called the ”Measured Criteria Assessment Score”.

Slide 9: 

In this first task, we conducted a literature review in the following areas: logistics and dry ports, methodologies employed in land use planning and the main theories of industrial location.

I don’t want to spend time on this point but I can answer your questions if you would like to know anything about this literature review.

Slide 10: 

As a result of this literature review, we established a set of 41 variables. These in turn are grouped into 17 factors. And the factors are organized into 4 categories: environmental factors, economic and social factors, accessibility factors, and location factors.

There are variables affecting the location but which are excluded from the analysis, for one of the following reasons:

– They are completely subjective and unmeasurable, such as political arrangements.

– They fall outside the focus of the evaluation we did. These are variables that affect the management of the terminal, such as the availability of technology, operating costs or the regulatory environment.

– There is no data available.

Slide 11: 

There are three environmental factors: Impact on the natural environment, Impact on the urban environment, and Hydrology. And, as I said before, all factors depend on several variables.

Slide 12: 

Economic and social factors are: Land price, Potential growth in demand and Hosting municipality range. This last term measures the balance between the benefit of proximity to a large population compared with the cost in terms of disruption to a part of that population.

Slide 13: 

Accessibility factors are those which are related to the ease of access to different infrastructures: rail network, high capacity roads network, airports, seaports and supplies and services.

Slide 14: 

Finally, Location factors are those that are related to the geography and connectivity of a place.

That is to say: Weather, Orography, Geology, Relation with other logistics platforms, Integration into the main supply chain infrastructures and Potential optimization of modal shift. The last three factors measure how influential a place can be in attracting freight traffic.

Slide 15: 

In this stage, geographic information of each variable is gathered and entered in the Geographic Information System. We studied the 10 logistics terminals that meet the following criteria:

– Having direct connection by rail.

– Allowing customs clearance.

– Being inland.

Slide 16: 

As I said before, for each variable we obtained a value for each dry port. These ”Measured Criteria Assessment Score” were registered in a database to feed the Geographic Information System.

Slide 17: 

The second task is to build the Bayesian Network model from the Measured Criteria Assessment Score.

Slide 18: 

Well,

Bayesian Networks are classified into artificial intelligence techniques. They are graphical representation of dependencies for probabilistic reasoning. For this reason, they allow to classify datasets and to establish relationships between data elements.

According to the type of structure of the data, different structure-learning methods can be applied. To build the Bayesian Network we chose a K2 structure-learning algorithm, because it allows the variables to be stratified.

In this kind of algorithm, all structures are equally likely at the start. The K2 algorithm begins by assuming that a node has no parents and at each step incrementally adds that node’s parent whose inclusion increases the gradient. For each node, the algorithm searches for the K2 parents that maximize the gradient.

Also it has an important advantage because it has a very low computing costs.

The result of applying the algorithm is this network in which the variable Distance to Natural Spaces is the root node of the network because no path enters it.

Slide 19: 

The third task consists of establishing weightings for the variables using a novel approach to rank within the Bayesian Network and for factors using a DELPHI questionnaire.

Slide 20: 

What do I mean when talking about a new way of ranking? By assessing the importance of each variable by depth compared with the root of the network, a certain weighting is set for each variable. Depth is measured by the number of links to reach to the network root. DNS is placed in Layer 1, the variables that need one link to reach DNS are placed in layer 2, and so on.

Slide 21: 

By using this depth, greater importance is for environmental variables, so the sustainability of locations requires a great respect for the natural environment and the urban environment in which they are located.

Slide 22: 

Weightings of the factors are established by applying the DELPHI methodology. These weightings are the result of an earlier research and can be found at Procedia Social and Behavioral Sciences, in paper: Application of a model based on the use of DELPHI methodology and Multicriteria Decision Analysis for the assessment of the quality of the Spanish dry ports location.

Slide 23: 

The fourth task is to obtain the Standarised Criteria Assessment Scores from the measured geographic information.

Slide 24: 

For this standardization, we convert all of the variables to benefit variables and then we use a spline interpolation. Depending on the grade of the spline, there were 3 different kinds of boundary conditions. The kind of interpolation is selected by minimizing the difference between the Measured Criteria Assessment Score and the Standardised Criteria Assessment Score.

Slide 25: 

Thus, we obtained a Standardized Criteria Assessment Score matrix.

Slide 26: 

Using the data I’ve just described, the last task is the application of a linear weighted multicriteria decision analysis where LQR (Location Quality Rate) is the ratio of the quality of each location;  EP (Environmental Protection) is a dichotomous function, which serves to exclude protected areas (worth 0 for protected locations and 1 for locations without environmental protection); SCAS (Standardized Criteria Assessment Score) is the score of the evaluation criteria for each variable and location. Finally, w (little w) and W (big w) are respectively the weightings of each variable from the Bayesian Network and that obtained from the DELPHI questionnaire to fix the importance of each factor. The locations with a higher value will be most appropriate for solving the problem.

It works in the same way as the McHarg graphic overlay method.

Slide 27: 

These are the results.

The most sustainable dry port is Monforte de Lemos, which scored well in terms of social and environmental factors and was balanced in the economic section, with 60.3% of the maximum possible score. Meanwhile, the least sustainable locations are Coslada, Abroñigal and Santander-Ebro, all of them with low social and environmental scores that are not compensated by the economic section.

For its part, Coslada has the best quality location if all the variables are taken into account, with 57.2%. These modest results show that both sustainability and quality of dry port locations in Spain are moderate. This can also be seen in the median values, of 41.3% and 48.8% respectively.

Slide 28: 

Conclusions are the following.

Determination of the most appropriate location to place dry ports is a geographic and multidisciplinary problem, with environmental, economic, social, accessibility and location repercussions.

Environmental variables prove to be the most important in deciding the location, so the sustainability of locations requires a great respect for the natural environment and the urban environment in which they are located.

Although four variables are unrelated to the rest of the network (Connectivity with the natural environment, Density of facility area, Quality of the railway and Existence of supplies and services), we must not lose sight of these variables in future evaluations since the lack of relationship is (only) due to the inability to establish preferential relationships between them because their values are practically the same for all locations of dry ports (but) in Spain.

The triangulation of different independent techniques provides greater confidence in the results, because the use of Bayesian Network and DELPHI methodology reduces the arbitrariness of the weightings of the Multicriteria Decision Analysis algorithm.

Slide 29: 

Well, that’s all. I hope the presentation of our research has been interesting for you, and I am now available to answer any questions you may have.


El debate posterior fue muy pero que muy interesante a pesar de mi dificultad para expresar en inglés conceptos matemáticos complejos acerca de cómo está configurada la red (los problemas del directo). Aunque mal del todo no debí hacerlo porque acabé nominado al premio a la mejor ponencia de la categoría «Planning for Sustainable Land Use and Transport». Y cabe destacar que me preguntaron por qué no había tenido en cuenta el transporte fluvial. La mujer que me preguntó no debe haber visitado mucho España…

 

Big Data para Ingenieros Civiles

El curso Big Data para Ingenieros Civiles pretende dotar al alumno de los fundamentos básicos del paradigma Big Data aplicado al sector de la ingeniería civil, permitiéndole conocer la tecnología que soporta este fenómeno en alza, revisar de manera aplicada los modelos matemático-computacionales más comúnmente utilizados y dotar de las nociones necesarias al ingeniero civil para afrontar un proyecto Big Data.

El curso está dirigido fundamentalmente a estudiantes de últimos cursos, recién titulados y profesionales de la Ingeniería Civil que quieran iniciarse en el mundo del Big Data, que es un ámbito de actuación profesional de creciente interés y demanda de empleo, donde los ingenieros civiles tenemos mucho que aportar por nuestro perfil y formación.

Fechas y horario

De carácter presencial, el curso se desarrollará en 2 días: 21 y 22 de mayo de 2015. Las clases tendrán lugar en el Aula 42 de la Escuela Técnica Superior de Ingenieros de Caminos, Canales y Puertos de la UPM (es una de las aulas de la Fundación Agustín de Betancourt, al lado de la “zona noble”), en horario de tarde:

– Jueves: de 16,00 a 20,30 horas.

– Viernes: de 16,00 a 20,30 horas.

Cada tarde habrá dos sesiones de 120 minutos con un descanso intermedio de 30 minutos.

Contenido

1ª parte. Fundamentos Big Data

¿Qué es Big Data?

¿Cómo funciona Big Data?

Ejemplos de Big Data

Cloud computing

Tecnología Hadoop y MapReduce

Modelos matemáticos para Big Data

2ª parte. Casos de uso en Ingeniería Civil

El ingeniero civil en un proyecto Big Data

Big Data en Smart Cities

Big Data en logística y planificación

Big Data en gestión portuaria

Big Data en gestión de tráfico y seguridad vial

Big Data en aeropuertos

Profesorado

El curso corre a cargo del Prof. Francisco Soler Flores.

Es Doctor Ingeniero Informático, Licenciado en Matemáticas y Master en Transportes, Logística y Seguridad Vial.

Profesor del Departamento de Matemáticas e Informática Aplicadas a la Ingeniería Civil y Naval de la E.T.S.I. de Caminos, Canales y Puertos de la Universidad Politécnica de Madrid. Experto en modelos de Inteligencia Artificial y Data Mining en el ámbito de la Ingeniería Civil.

Ha sido responsable de la línea de investigación de Data Mining y Machine Learning en el grupo de Investigación reconocido por la UPM LET&GO.

Ha participado en más de 20 proyectos de investigación como responsable de Análisis de Datos y cuenta con más de 50 papers en el ámbito de la Ingeniería Civil, Inteligencia Artificial y Análisis de Datos.

Y, por si todo esto fuera poco, ¡es quien me ha ayudado con la parte matemática de la Tesis, por lo que garantizo que con él se aprende y que su disposición para enseñar es excelente!

Matrícula

Hay varios precios según la situación:

– Estudiantes de la Escuela de Caminos: 90 euros.

– Otros estudiantes: 100 euros

– Ingenieros de Caminos y Civiles en desempleo: 100 euros.

– Ingenieros de Caminos y Civiles en activo: 120 euros.

– Otros: 150 euros.

Información y preinscripciones

Información y preinscripciones en la Fundación Agustín de Betancourt o enviando el formulario adjunto a: alargal@fundacionabetancourt.org. Una vez confirmada por escrito la inscripción, se darán instrucciones para formalizar la misma.

NOMBRE:…….…

MAIL:……….

TELÉFONO DE CONTACTO:…….…

ESTUDIANTE (SI/NO):…….…

TITULACIÓN:…….…

SITUACIÓN LABORAL:……….