Una de las anĆ©cdotas mĆ”s comunes de un proyecto de software es que siempre hay una clase o una función que serĆ” recordada por el nĆŗmero de lĆneas que esta tuvo. Estoy seguro de que al menos una vez hemos escuchado:
“No toques esa clase, tiene como 1000 lĆneas de código”
Developer anónimo
Este es un dato particular de acuerdo a los proyectos en los que estuve y conversaciones entre amigos. Lo que es menos comĆŗn, es saber cuĆ”ntas lĆneas de código tiene el proyecto en el que estamos trabajando.
Si en este momento nos hacemos esa pregunta o se la hacemos a otro miembro del equipo, es posible de que no consigan una respuesta concreta. Si bien es cierto no considero necesario ser 100% precisos, he notado que pocas personas se preocupan de esa métrica, a menos claro, de que haya algún costo asociado.
Si no les ha pasado, les comento que casos como este se dan desde hace mucho en proyectos donde se audita código. Sin ir muy lejos, Amazon liberó [CodeGuru], un servicio (aĆŗn en preview) que analiza el código fuente. Como es de esperar, el costo estĆ” asociado al nĆŗmero de lĆneas y no es el Ćŗnico producto o servicio que hace este [tipo de trabajos]
¿Qué es lo que regularmente encontraremos?
He participado en proyectos donde el anĆ”lisis o auditorĆa de calidad de software era uno de los objetivos mĆ”s importantes. Muchas veces el costo de servicios adquiridos āu ofrecidosā estaba relacionado al nĆŗmero de lĆneas de código (o LoC por [Lines of Code]).
En cada trabajo era comĆŗn confirmar lo encontrado en proyectos anteriores:
- Pocas personas conocĆan el nĆŗmero de LoC o la importancia de este indicador
- Una prĆ”ctica conocida āy en algunos casos, aceptadaā era “agregar código de ejemplo, ir cambiando y probando pero guardar la versión original por si algo se malograba”
- Muchas veces se mantenĆan las carpetas de plantillas y ejemplos de las librerĆas y componentes de terceros que en algunos casos ya no se utilizaban
Ya en un caso concreto, estuve en un proyecto donde el desarrollo tenĆa mĆ”s de un millón de LoC y estaba seguro de que eso no podĆa ser posible pues las funcionalidades del sistema no reflejaban dicha realidad.
SabĆa que estaba frente a un caso de Código Muerto, pero tenĆa que demostrarlo.
¿Qué es Código Muerto?
Sin entrar en detalles (pues es posible que encuentren discrepancias y hasta [una canción]), el código muerto o “Dead Code” es aquel que no aporta valor al negocio.
El código muerto se puede clasificar de la siguiente manera:
- Código que no se usa: Muy usual en los proyectos de software, algunas veces no se recuerda su objetivo inicial y por lo general ocurre pues las necesidades van cambiando y el código no se depura adecuadamente luego de cada cambio (mucho cuidado con las frases “es que no hay tiempo” o “lo vemos despuĆ©s”)
- Código que se ejecuta pero que no se usa: Aquà entran los casos como los de variables asignadas o llamadas a funciones cuyo resultado no es utilizado. Esto es nocivo pues ademÔs ser código inútil, consume recursos del sistema.
¿Cómo identificar Código Muerto?
Con el paso del tiempo preparĆ© una secuencia de anĆ”lisis que me sirvió para encontrar casos de código muerto bajo la premisa de que si algo se define en el programa, este debe ser utilizado de manera efectiva. La lista puede parecer obvia, pero ya estĆ” demostrado que en tecnologĆa no debemos confiar en las obviedades š
- Variables
- Funciones
- Clases
- Comentarios (sean redundantes o código que fue comentado para ser utilizado “mĆ”s adelante”)
- Elementos de archivos de configuración (por ejemplo, secciones comentads o que ya no se utilizan)
- Archivos de configuración
- LibrerĆas (componentes de terceros)
- Elementos idĆ©nticos (funciones, clases archivos, librerĆas o carpetas distribuidos en ubicaciones distintas)
- Elementos parecidos (librerĆas con versiones diferentes, funciones o clases que inicialmente eran una copia de la otra)
- Carpetas y archivos varios que poco a poco quedan relegados hasta el olvido
Un hecho común en todos los casos, es que el código muerto existe debido al temor a perder código o a malograr el sistema construido. Esto tiene relación directa con el desconocimiento de que los gestores de versiones permiten volver al pasado si es que se necesita ver algo que ha sido borrado.
Otra consecuencia es que a mÔs código muerto, mÔs complejo serÔ el entendimiento de nuestro sistema, la mantenibilidad serÔ afectada y a su vez generarÔ dependencias con un programador en particular (a veces pueden ser mÔs personas). Recuerden, el código es de todos los miembros del equipo y mientras menos dependencias, mejor.
¿Qué herramientas debemos usar?
Puede que parezca una broma, pero un elemento muy importante es la inspección visual. A pesar de ello, esta debe pasar a segundo plano pues debemos evitar confiar totalmente de los presentimientos o “literalmente” de puntos de vista.
De acuerdo a esta premisa, lo primero que debemos hacer es trabajar con [herramientas de anƔlisis estƔtico] que nos brinden un enfoque acertado de lo que estƔ ocurriendo.
A pesar de ello, hasta el momento no he encontrado una herramienta que brinde un indicador de código muerto bajo un enfoque holĆstico. Es asĆ que utilizo principalmente [SonarQube] como base del trabajo a realizar.
Regresando al caso del millón de LoC, encontré pistas que me ayudaron a confirmar la existencia del temible código muerto.
Si queremos empezar con estas prĆ”cticas, algo que nos podrĆa ayudar estĆ” incluido en las herramientas del navegador web. Una de las que ha llamado mi atención es la utilizada para analizar la cobertura de los archivos JavaScript y CSS. Esta viene en [Chrome] y no es complicado de usar/entender.
¿Qué conseguà luego de presentar lo encontrado?
El objetivo de mi trabajo en dicho proyecto, fue preparar un informe sobre lo que se estaba construyendo y sobre eso un plan de trabajo para implementar una nueva arquitectura. No me parecĆa adecuado llegar con una presentación llena de indicadores ni menos seƱalar responsables (aunque en algunos casos ese ha sido mi trabajo), asĆ que gracias al apoyo y explicaciones que el equipo dio cuando estaba analizando el código, tenĆa el conocimiento necesario para “limpiarlo”, al menos en casos que parecĆan obvios o donde veĆa que complejidad baja o media.
Como este tipo de trabajos me gustan, no parĆ© hasta eliminar 95% del código del sistema. No esperaba llegar a ese nĆŗmero pero mĆ”s de un millón lĆneas era código muerto que se podĆa limpiar fĆ”cilmente.
Nada mejor que llegar con un informe que tenga un entregable como ese š
La buena noticias es que el equipo quedó sorprendido. CuÔndo me preguntaron cómo lo hice, les comenté que empecé por las obviedades (y ya saben lo que pienso de ellas :)) creo que eso los animó a seguir limpiando (luego de una segunda limpieza el código no superaba las 30 mil LoC)
¿Qué es lo que aprend�
- Es posible que este tipo de trabajos sea incomprendido al principio, pero se consigue mucho enseƱando con el ejemplo. En dicho proyecto tenĆa que preparar una arquitectura que aproveche lo que ya estaba construido, pero ante las sospechas de código muerto, decidĆ detenerme un momento y evaluar cómo eliminarlo, primero por mi cuenta y luego con el equipo.
- Lo que he encontrado en muchos casos, es que hay pocas intenciones de refactorización que a veces no se dan por el uso desmedido de frameworks y herramientas. Lo que creo que se debe hacer es sentar una base medible de lo que estÔ sucediendo sin olvidar que lo mÔs se hace en un proyecto de software es la construcción del mismo. Si es asà ¿por qué no saber cómo va creciendo nuestro código?
- La automatización de pruebas es muy importante pero esta se debe postergar si hay casos obvios de código muerto, he comprobado que a veces resulta mÔs rÔpido borrar (sin miedo) que ponermos a programar un caso de prueba.
- Siempre debemos utilizar un gestor de versiones (personalmente prefiero Git sobre GitHub) y tenerlo enlazado a un motor de automatización (como [Jenkins] o [Azure DevOps], ambos me parecen buenos y Azure DevOps es mÔs sencillo de configurar) que ayude a tener visibilidad de la integración continua.
- El equipo de desarrollo pasa a otro nivel de conocimiento, pues ademÔs de entender la importancia de prÔcticas de limpieza de código muerto se abre una nueva puerta hacia la calidad del producto.
- Si la confianza y comunicación son las adecuadas, este tipo de situaciones se convierten en anécdotas del equipo.
¿CuÔl fue mi reflexión final?
Antes de refactorizar o hacer lo que sea en el sistema, eliminen el Código Muerto, no teman.
Un abrazo,
Fuente imagen cabecera: [Finding Dead Code]