O Aprendizado Profundo é uma técnica de utiliza um tipo específico de rede neural artificial chamado Rede Neural Convolucional (do Inglês, Convolutional Neural Network – CNN). Atualmente, as CNNs são uma das técnicas de aprendizado de máquina mais populares nas tarefas de reconhecimento de imagem e aprendizado visual, devido à sua característica única de preservar as relações de imagem local, enquanto realiza a redução de dimensionalidade (Ker et al. 2018). Tais características permitem capturar importantes relações de recurso em uma imagem (como a forma como os pixels de uma borda se unem para formar uma linha), reduzindo assim o número de parâmetros que o algoritmo precisa calcular. CNNs são capazes de tomar como entradas e processar imagens bidimensionais, bem como imagens tridimensionais com pequenas modificações (Ker et al. 2018).