{"id":2439,"date":"2022-07-25T10:06:20","date_gmt":"2022-07-25T10:06:20","guid":{"rendered":"https:\/\/martra.uadla.com\/?p=2439"},"modified":"2022-07-25T10:33:37","modified_gmt":"2022-07-25T10:33:37","slug":"preparando-la-certificacion-tensorflow-developer-by-google-2-transfer-learning-image-classification","status":"publish","type":"post","link":"https:\/\/martra.uadla.com\/preparando-la-certificacion-tensorflow-developer-by-google-2-transfer-learning-image-classification\/","title":{"rendered":"Preparando la certificaci\u00f3n Tensorflow Developer by Google. 2-Transfer learning &#038; image classification."},"content":{"rendered":"\n<p>En el primer post de <a href=\"https:\/\/martra.uadla.com\/preparando-la-certificacion-tensorflow-developer-by-google-1-image-clasification\/\" target=\"_blank\" rel=\"noreferrer noopener\">preparar la certificaci\u00f3n de TensorFlow Developer<\/a>,  vimos el notebook preparado para solucionar un problema de clasificaci\u00f3n de im\u00e1genes multiples usando el dataset Fashion MNIST que viene con Tensorflow. <\/p>\n\n\n\n<p>En el notebook actual voy a usar un Dataset muy conocido, el de gatos y perros de Microsoft, opara solucionar un problema de clasificaci\u00f3n binaria. El Dataset muy diferente al usado en el notebook anterior. No tan solo por el tama\u00f1o de las im\u00e1genes. Este debe descargarse un fichero .zip, descomprirlo en el disco y cargar las imagines usando un ImageDataGenerator. Una t\u00e9cnica que no se vio en el ejemplo anterior. <\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Puntos cubiertos del examen TensorFlow Developer en el notebook. <\/h3>\n\n\n\n<p><strong>(2) Building and training neural network models using TensorFlow 2.x<\/strong><br><mark style=\"background-color:#FDE64B\" class=\"has-inline-color has-brown-color\">\u274f Build, compile and train machine learning (ML) models using TensorFlow.<br>\u274f Preprocess data to get it ready for use in a model.<\/mark><br>\u274f Use models to predict results.<br><mark style=\"background-color:#FDE64B\" class=\"has-inline-color has-brown-color\">\u274f Build sequential models with multiple layers.<\/mark><br>\u274f<mark style=\"background-color:#FDE64B\" class=\"has-inline-color has-yellow-color\"> Build and train models for binary classification.<\/mark><br>\u274f Build and train models for multi-class categorization.<br><mark style=\"background-color:#FDE64B\" class=\"has-inline-color has-brown-color\">\u274f Plot loss and accuracy of a trained model.<\/mark><br><mark style=\"background-color:#FDE64B\" class=\"has-inline-color has-brown-color\">\u274f Identify strategies to prevent overfitting, including augmentation and dropout.<br>\u274f Use pretrained models (transfer learning).<\/mark><br>\u274f Extract features from pre-trained models.<br>\u274f Ensure that inputs to a model are in the correct shape.<br>\u274f Ensure that you can match test data to the input shape of a neural network.<br>\u274f Ensure you can match output data of a neural network to specified input shape for test data.<br><mark style=\"background-color:#FDE64B\" class=\"has-inline-color has-brown-color\">\u274f Understand batch loading of data.<\/mark><br>\u274f Use callbacks to trigger the end of training cycles.<br>\u274f Use datasets from different sources.<br>\u274f Use datasets in different formats, including json and csv.<br>\u274f Use datasets from tf.data.datasets.<\/p>\n\n\n\n<p><strong>(3) Image classification<br><\/strong><mark style=\"background-color:#FDE64B\" class=\"has-inline-color has-brown-color\">\u274f Define Convolutional neural networks with Conv2D and pooling layers.<br>\u274f Build and train models to process real-world image datasets.<br>\u274f Understand how to use convolutions to improve your neural network.<br>\u274f Use real-world images in different shapes and sizes..<br>\u274f Use image augmentation to prevent overfitting.<br>\u274f Use ImageDataGenerator.<br>\u274f Understand how ImageDataGenerator labels images based on the directory structure.<\/mark><\/p>\n\n\n\n<p>He intentado cubrir todas las marcadas en amarillo en el Notebook I<a href=\"https:\/\/github.com\/oopere\/TensorFlowCertification\/blob\/main\/IMAGERecog.ipynb\" target=\"_blank\" rel=\"noreferrer noopener\">MAGERecog.ipynb<\/a> disponible en el r<a href=\"https:\/\/github.com\/oopere\/TensorFlowCertification\" target=\"_blank\" rel=\"noreferrer noopener\">epositorio de GitHub<\/a> donde est\u00e1n todos los notebooks preparados para el examen de TensorFlow Developer. <\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Contenido y estructura del notebook. <\/h3>\n\n\n\n<p>El notebook esta dividido en diferentes secciones. Primero se cargan las librer\u00edas necesarias y los datos. Se crea la estructura. Despu\u00e9s se definen funciones gen\u00e9ricas, los modelos. A partir de aqu\u00ed se hace el aprendizaje de los diferentes modelos, con y sin data augmentation. En el ultimo apartado se usan dos procesos diferentes de Transfer Learning, usando los modelos prentrenados InceptionV3 y VGG16. <\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Importar librer\u00edas y datos. <\/h4>\n\n\n\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"python\" data-enlighter-theme=\"\" data-enlighter-highlight=\"\" data-enlighter-linenumbers=\"\" data-enlighter-lineoffset=\"\" data-enlighter-title=\"\" data-enlighter-group=\"\">#First steep is import the libraries. \nimport tensorflow as tf\ntf.random.set_seed(42)\n#Numpy is a lybrary that allow us to work with arrays. \nimport numpy as np\n#keras is an open source neural networks lybrary writted in python that run's in varios frameworks, TensorFlow included. \nfrom tensorflow import keras\nimport matplotlib.pyplot as plt\nimport matplotlib.image as mpimg\nfrom tensorflow.keras.preprocessing.image import ImageDataGenerator\n\nfrom tensorflow.keras.optimizers import RMSprop\nfrom tensorflow.keras.optimizers import Adam\n\nprint (tf.__version__)\n          \ngEpochs=30  <\/pre>\n\n\n\n<p>Se importan las t\u00edpicas librer\u00edas, se define una semilla para que los datos se repartan siempre igual en todas las ejecuciones. Importo dos optimizadores, por que he realizado pruebas con ambos, aunque me gusta m\u00e1s c\u00f3mo funciona Adam. <\/p>\n\n\n\n<p>Se importa ImageDataGenerator que se utiliza para trabajar con el Dataset. <\/p>\n\n\n\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"generic\" data-enlighter-theme=\"\" data-enlighter-highlight=\"\" data-enlighter-linenumbers=\"\" data-enlighter-lineoffset=\"\" data-enlighter-title=\"\" data-enlighter-group=\"\">#obtain the data from microsoft.com\n#the same dataset is available in kaggle but with a different organization\n#https:\/\/www.kaggle.com\/competitions\/dogs-vs-cats\/data\n\n#If it dosn't run be sure to have wget installed in your local machine. It works fine in Colab. \n\n!wget --no-check-certificate \\\nhttps:\/\/download.microsoft.com\/download\/3\/E\/1\/3E1C3F21-ECDB-4869-8368-6DEBA77B919F\/kagglecatsanddogs_5340.zip \\-O \/tmp\/catsvsdogs.zip<\/pre>\n\n\n\n<p>Obtenemos el fichero .zip. Hay que recalcar que el c\u00f3digo funciona tanto en Google Colab como en un notebook Jupyter en el disco local.  Nos deja el fichero .zip en el directorio \/tmp\/<\/p>\n\n\n\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"generic\" data-enlighter-theme=\"\" data-enlighter-highlight=\"\" data-enlighter-linenumbers=\"\" data-enlighter-lineoffset=\"\" data-enlighter-title=\"\" data-enlighter-group=\"\">#unzip the data\nimport zipfile\ncvr_zip_file = '\/tmp\/catsvsdogs.zip'\nzipmem = zipfile.ZipFile(cvr_zip_file)\nzipmem.extractall('\/tmp\/catsvsdogs')\nzipmem.close()<\/pre>\n\n\n\n<p>Para descomprimirlo importamos zipfile, y no hay ning\u00fan secreto. el zip viene con las imagenes en dos directorios: <\/p>\n\n\n\n<pre class=\"wp-block-preformatted\">dira<strong>=<\/strong>\"\/tmp\/catsvsdogs\/PetImages\/Cat\/\" \ndirb<strong>=<\/strong>\"\/tmp\/catsvsdogs\/PetImages\/Dog\/\" <\/pre>\n\n\n\n<p>Tendremos que pasarlo de estos dos directorios a otros para tener datos de entreno y datos de validaci\u00f3n. <\/p>\n\n\n\n<pre class=\"wp-block-preformatted\">destDirTraina<strong>=<\/strong>'\/tmp\/datacvd\/train\/cats\/' \ndestDirTrainb<strong>=<\/strong>'\/tmp\/datacvd\/train\/dogs\/'\ndestDirVala<strong>=<\/strong>'\/tmp\/datacvd\/validation\/cats\/' \ndestDirValb<strong>=<\/strong>'\/tmp\/datacvd\/validation\/dogs\/'\ndirTrain<strong>=<\/strong>'\/tmp\/datacvd\/train\/'\ndirVal<strong>=<\/strong>'\/tmp\/datacvd\/validation\/'<\/pre>\n\n\n\n<p>La estructura de directorios se debe crear en el disco, ya sea en el que nos monta de forma temporal Colab, como en el nuestro. <\/p>\n\n\n\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"python\" data-enlighter-theme=\"\" data-enlighter-highlight=\"\" data-enlighter-linenumbers=\"\" data-enlighter-lineoffset=\"\" data-enlighter-title=\"\" data-enlighter-group=\"\">#create the directory structure\nimport os\n\n#we need a try block, because it fails when the directories already exist. \ntry:\n  os.mkdir('\/tmp\/datacvd')\n  os.mkdir('\/tmp\/datacvd\/train')\n  os.mkdir('\/tmp\/datacvd\/validation')\n  os.mkdir('\/tmp\/datacvd\/train\/cats')\n  os.mkdir('\/tmp\/datacvd\/train\/dogs')\n  os.mkdir('\/tmp\/datacvd\/validation\/cats')\n  os.mkdir('\/tmp\/datacvd\/validation\/dogs')\nexcept:\n  pass<\/pre>\n\n\n\n<p>La funci\u00f3n mkdir devuelve una excepci\u00f3n en caso de que el directorio ya est\u00e9 creado, por eso lo he puesto dentro de un bloque try y he ignorado la excepci\u00f3n. <\/p>\n\n\n\n<p>Con los directorios ya creados podemos copiar las im\u00e1genes, para ello tengo una funci\u00f3n que recibe los directorios origen, los destino y el n\u00famero de im\u00e1genes que quiero usar como validadoras. <\/p>\n\n\n\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"python\" data-enlighter-theme=\"\" data-enlighter-highlight=\"\" data-enlighter-linenumbers=\"\" data-enlighter-lineoffset=\"\" data-enlighter-title=\"\" data-enlighter-group=\"\">#we need 4 datasets, two for training the model and two for validate or test the model. \n#to classify the images in this dataset we can move it from their original directories to \n#a new ones with the correct structure. \n\ndef getimagesfromdir(dira=\"\", dirb=\"\", destDirTraina=\"\", destDirTrainb=\"\", destDirVala=\"\", destDirValb=\"\", NumVal=100):\n    from shutil import copyfile\n\n    #this array contents all the images to move\/copy\n    imagesA=[]\n    imagesB=[]\n\n    for imagename in os.listdir(dira):\n      imageCat = dira + imagename\n      if (os.path.getsize(imageCat)) > 0:\n        imagesA.append(imagename)\n\n    for imagename in os.listdir(dirb):\n      imageDog = dirb + imagename\n      if (os.path.getsize(imageDog)) > 0:\n        imagesB.append(imagename)\n\n\n    counterImage = 0\n    for imagename in imagesA:\n      if  counterImage &lt; 2000:\n        copyfile(dira + imagename, destDirVala+imagename)\n      else:\n        copyfile(dira + imagename, destDirTraina+imagename)\n      counterImage +=1\n\n    counterImage = 0\n    for imagename in imagesB:\n      if  counterImage &lt; 2000:\n        copyfile(dirb + imagename, destDirValb+imagename)\n      else:\n        copyfile(dirb + imagename, destDirTrainb+imagename)\n      counterImage +=1\n\n    print(len(os.listdir(destDirValb)))\n    print(len(os.listdir(destDirTrainb)))\n    print(len(os.listdir(destDirVala)))\n    print(len(os.listdir(destDirTraina)))\n    return imagesA, imagesB<\/pre>\n\n\n\n<p>La llamada a la funci\u00f3n es muy sencilla: <\/p>\n\n\n\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"python\" data-enlighter-theme=\"\" data-enlighter-highlight=\"\" data-enlighter-linenumbers=\"\" data-enlighter-lineoffset=\"\" data-enlighter-title=\"\" data-enlighter-group=\"\">imagesCats, imagesDogs = getimagesfromdir(dira=dira, \n                                          dirb=dirb, \n                                         destDirTraina=destDirTraina, \n                                         destDirTrainb=destDirTrainb,\n                                         destDirVala=destDirVala, \n                                         destDirValb=destDirValb,\n                                         NumVal=2000)<\/pre>\n\n\n\n<p>La llamada a la funci\u00f3n nos devuelve los datos divididos en dos arrays, uno para cada categor\u00eda, pero no es lo importante. Lo que realmente ha hecho es dividir las im\u00e1genes en los cuatro directorios para poder crear datos de entreno y datos de validaci\u00f3n partiendo del directorio en el que se han situado. <\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Funciones del Notebook. <\/h4>\n\n\n\n<p>Son las funciones gen\u00e9ricas, usadas para imprimir gr\u00e1ficos, o tratar los datos. Muchas de ellas compartidas entre diferentes notebooks. <\/p>\n\n\n\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"generic\" data-enlighter-theme=\"\" data-enlighter-highlight=\"\" data-enlighter-linenumbers=\"\" data-enlighter-lineoffset=\"\" data-enlighter-title=\"\" data-enlighter-group=\"\">def SimpleDataGenerator():\n    #TRAIN Dataset\n    #Normalize the images\n    train_idg = ImageDataGenerator(rescale=1\/255)\n    train_data = train_idg.flow_from_directory(\n        '\/tmp\/datacvd\/train', \n        target_size = (150, 150), \n        batch_size = 105, \n        class_mode='binary'\n    )\n    #VALIDATION Dataset\n    val_idg = ImageDataGenerator(rescale=1\/255)\n    val_data = val_idg.flow_from_directory(\n        '\/tmp\/datacvd\/validation', \n        target_size = (150, 150), \n        batch_size = 100, \n        class_mode='binary'\n    )\n    return train_data, val_data<\/pre>\n\n\n\n<p> Aqu\u00ed se preparan los juegos de datos, el de training y el de validation. Usando <strong><em>ImageDataGenerator<\/em><\/strong> se normalizan las im\u00e1genes. Acto seguido con <strong><em>flow_from_directory<\/em><\/strong> se cargan las im\u00e1genes. Le podemos indicar el target size, pera que todas tengan el mismo, debe coincidir con el shape de entrada de nuestro modelo. <\/p>\n\n\n\n<p>La funci\u00f3n devuelvo los dos juegos de datos. <\/p>\n\n\n\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"python\" data-enlighter-theme=\"\" data-enlighter-highlight=\"\" data-enlighter-linenumbers=\"\" data-enlighter-lineoffset=\"\" data-enlighter-title=\"\" data-enlighter-group=\"\">#Print accuracy &amp; val_accura vs loss &amp; val_loss \n\ndef plot_loss_acc(history):\n  '''Plots the training and validation loss and accuracy from a history object'''\n  acc = history.history['accuracy']\n  val_acc = history.history['val_accuracy']\n  loss = history.history['loss']\n  val_loss = history.history['val_loss']\n\n  epochs = range(len(acc))\n\n  plt.plot(epochs, acc, 'bo-', label='Training accuracy')\n  plt.plot(epochs, val_acc, 'go-', label='Validation accuracy')\n  plt.title('Training and validation accuracy')\n  plt.legend()\n\n  plt.figure()\n\n  plt.plot(epochs, loss, 'bo-', label='Training Loss')\n  plt.plot(epochs, val_loss, 'go-', label='Validation Loss')\n  plt.title('Training and validation loss')\n  plt.legend()\n\n  plt.show()<\/pre>\n\n\n\n<p>Esta funci\u00f3n nos crea un gr\u00e1fico comparando el loss y el accuracy del history de la ejecuci\u00f3n del modelo que le pasemos. <\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Modelos. <\/h4>\n\n\n\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"python\" data-enlighter-theme=\"\" data-enlighter-highlight=\"\" data-enlighter-linenumbers=\"\" data-enlighter-lineoffset=\"\" data-enlighter-title=\"\" data-enlighter-group=\"\">def get_model(kindmodel):\n    switcher = {\n\n        #it's a minimal model for images, with just an Convolutionatl layer and a MaxPooling layer\n        0: tf.keras.models.Sequential([\n            tf.keras.layers.Conv2D(16, (4,4), activation=\"relu\", input_shape=(150, 150, 3)),\n            tf.keras.layers.MaxPooling2D(2,2),  \n            tf.keras.layers.Flatten(), \n            tf.keras.layers.Dense(128, activation=\"relu\"), \n            tf.keras.layers.Dense(1, activation=\"sigmoid\")]),\n        #keeping it simple just add more convolutional anv maxpooling layers\n        #es incluso menos pesado que el anterior, gracias a las capas de maxpooling\n        1: tf.keras.models.Sequential([\n            tf.keras.layers.Conv2D(16, (4,4), activation=\"relu\", input_shape=(150, 150, 3)),\n            tf.keras.layers.MaxPooling2D(2,2),  \n            tf.keras.layers.Conv2D(32, (4,4), activation=\"relu\"),\n            tf.keras.layers.MaxPooling2D(2,2),  \n            tf.keras.layers.Conv2D(64, (4,4), activation=\"relu\"),\n            tf.keras.layers.MaxPooling2D(2,2),  \n            tf.keras.layers.Flatten(), \n            tf.keras.layers.Dense(512, activation=\"relu\"), \n            tf.keras.layers.Dense(1, activation=\"sigmoid\")]),\n        3: tf.keras.models.Sequential([\n            tf.keras.layers.Conv2D(16, (4,4), activation=\"relu\", input_shape=(150, 150, 3)),\n            tf.keras.layers.MaxPooling2D(2,2),  \n            tf.keras.layers.Dropout(0.5), \n            tf.keras.layers.Flatten(), \n            tf.keras.layers.Dense(128, activation=\"relu\"), \n            tf.keras.layers.Dense(1, activation=\"sigmoid\")]),\n        4: tf.keras.models.Sequential([\n            tf.keras.layers.Conv2D(16, (4,4), activation=\"relu\", input_shape=(150, 150, 3)),\n            tf.keras.layers.MaxPooling2D(2,2),\n            tf.keras.layers.Dropout(0.2),   \n            tf.keras.layers.Conv2D(32, (4,4), activation=\"relu\"),\n            tf.keras.layers.MaxPooling2D(2,2),  \n            tf.keras.layers.Dropout(0.2),  \n            tf.keras.layers.Conv2D(64, (4,4), activation=\"relu\"),\n            tf.keras.layers.MaxPooling2D(2,2),  \n            tf.keras.layers.Dropout(0.5), \n            tf.keras.layers.Flatten(), \n            tf.keras.layers.Dense(512, activation=\"relu\"), \n            tf.keras.layers.Dense(1, activation=\"sigmoid\")]),\n    }\n    return switcher.get(kindmodel, None)<\/pre>\n\n\n\n<p>Los modelos los he puesto todos dentro de una funci\u00f3n en lugar de irlos creando por el notebook. Me facilita la vida para compararlos, buscarlos o editarlos. como pode\u00eds ver hay dos modelos y son todos muy sencillos. <\/p>\n\n\n\n<p>Tenemos un modelo con una sola capa convolucional y despu\u00e9s otro con tres capas convolucionales. Cada capa convolutional se acompa\u00f1a de una capa MaxPooling2D. <\/p>\n\n\n\n<p>Los dos siguientes modelos son exactamente los mismos pero incorporando capas de Dropout detr\u00e1s de la capa MaxPooling2D. <\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Modelo con una sola capa convolucional. <\/h4>\n\n\n\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"python\" data-enlighter-theme=\"\" data-enlighter-highlight=\"\" data-enlighter-linenumbers=\"\" data-enlighter-lineoffset=\"\" data-enlighter-title=\"\" data-enlighter-group=\"\">tf.keras.models.Sequential([\n            tf.keras.layers.Conv2D(16, (4,4), activation=\"relu\", input_shape=(150, 150, 3)),\n            tf.keras.layers.MaxPooling2D(2,2),  \n            tf.keras.layers.Flatten(), \n            tf.keras.layers.Dense(128, activation=\"relu\"), \n            tf.keras.layers.Dense(1, activation=\"sigmoid\")])<\/pre>\n\n\n\n<p>Es un modelo muy simple, tan solo una capa convolucional, una de MaxPooling2D y la capa densa con 128 neurones. <\/p>\n\n\n\n<p>Resultados: <\/p>\n\n\n\n<p>6s 180ms\/step &#8211; loss: 0.1124 &#8211; accuracy: 0.9857 &#8211; val_loss: 1.4532 &#8211; val_accuracy: 0.8167<\/p>\n\n\n\n<p>84s 418ms\/step &#8211; loss: 0.3824 &#8211; accuracy: 0.8318 &#8211; val_loss: 0.3082 &#8211; val_accuracy: 0.8762<sup>Con Data Augmentation<\/sup><\/p>\n\n\n\n<p>Como es normal, el modelo tiene un gran problema de overfitting, que se ve solucionado parcialmente al usar Image Augmentation. <\/p>\n\n\n\n<div class=\"wp-block-columns is-layout-flex wp-container-core-columns-is-layout-9d6595d7 wp-block-columns-is-layout-flex\">\n<div class=\"wp-block-column is-layout-flow wp-block-column-is-layout-flow\">\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"373\" height=\"264\" src=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-37.png\" alt=\"\" class=\"wp-image-2443\" srcset=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-37.png 373w, https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-37-300x212.png 300w\" sizes=\"auto, (max-width: 373px) 100vw, 373px\" \/><\/figure>\n<\/div>\n\n\n\n<div class=\"wp-block-column is-layout-flow wp-block-column-is-layout-flow\">\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"373\" height=\"264\" src=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-38.png\" alt=\"\" class=\"wp-image-2444\" srcset=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-38.png 373w, https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-38-300x212.png 300w\" sizes=\"auto, (max-width: 373px) 100vw, 373px\" \/><\/figure>\n<\/div>\n<\/div>\n\n\n\n<p>Con Image Augmentation: <\/p>\n\n\n\n<div class=\"wp-block-columns is-layout-flex wp-container-core-columns-is-layout-9d6595d7 wp-block-columns-is-layout-flex\">\n<div class=\"wp-block-column is-layout-flow wp-block-column-is-layout-flow\">\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"386\" height=\"264\" src=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-39.png\" alt=\"\" class=\"wp-image-2445\" srcset=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-39.png 386w, https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-39-300x205.png 300w\" sizes=\"auto, (max-width: 386px) 100vw, 386px\" \/><figcaption>Con Image Augmentation<\/figcaption><\/figure>\n<\/div>\n\n\n\n<div class=\"wp-block-column is-layout-flow wp-block-column-is-layout-flow\">\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"380\" height=\"264\" src=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-40.png\" alt=\"\" class=\"wp-image-2446\" srcset=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-40.png 380w, https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-40-300x208.png 300w\" sizes=\"auto, (max-width: 380px) 100vw, 380px\" \/><figcaption>Con Image Augmentation<\/figcaption><\/figure>\n<\/div>\n<\/div>\n\n\n\n<h4 class=\"wp-block-heading\">Modelo con tres capas convolucionales. <\/h4>\n\n\n\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"python\" data-enlighter-theme=\"\" data-enlighter-highlight=\"\" data-enlighter-linenumbers=\"\" data-enlighter-lineoffset=\"\" data-enlighter-title=\"\" data-enlighter-group=\"\">tf.keras.models.Sequential([\n            tf.keras.layers.Conv2D(16, (4,4), activation=\"relu\", input_shape=(150, 150, 3)),\n            tf.keras.layers.MaxPooling2D(2,2),  \n            tf.keras.layers.Conv2D(32, (4,4), activation=\"relu\"),\n            tf.keras.layers.MaxPooling2D(2,2),  \n            tf.keras.layers.Conv2D(64, (4,4), activation=\"relu\"),\n            tf.keras.layers.MaxPooling2D(2,2),  \n            tf.keras.layers.Flatten(), \n            tf.keras.layers.Dense(512, activation=\"relu\"), \n            tf.keras.layers.Dense(1, activation=\"sigmoid\")])<\/pre>\n\n\n\n<p>Este modelo es el t\u00edpico en el que a cada convolucional le sigue una de MaxPooling2D, y se aumentan los filtros aplicados en cada capa convolucional a\u00f1adida. Se aumentan tambi\u00e9n el n\u00famero de neurones de la capa Densa.   <\/p>\n\n\n\n<p>Resultados: <\/p>\n\n\n\n<p>36s 180ms\/step &#8211; loss: 0.1124 &#8211; accuracy: 0.9857 &#8211; val_loss: 1.4532 &#8211; val_accuracy: 0.8167<\/p>\n\n\n\n<p>84s 418ms\/step &#8211; loss: 0.3824 &#8211; accuracy: 0.8318 &#8211; val_loss: 0.3082 &#8211; val_accuracy: 0.8762<sup>Con Data augmentation<\/sup><\/p>\n\n\n\n<div class=\"wp-block-columns is-layout-flex wp-container-core-columns-is-layout-9d6595d7 wp-block-columns-is-layout-flex\">\n<div class=\"wp-block-column is-layout-flow wp-block-column-is-layout-flow\">\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"380\" height=\"264\" src=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-41.png\" alt=\"\" class=\"wp-image-2448\" srcset=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-41.png 380w, https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-41-300x208.png 300w\" sizes=\"auto, (max-width: 380px) 100vw, 380px\" \/><\/figure>\n<\/div>\n\n\n\n<div class=\"wp-block-column is-layout-flow wp-block-column-is-layout-flow\">\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"373\" height=\"264\" src=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-42.png\" alt=\"\" class=\"wp-image-2449\" srcset=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-42.png 373w, https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-42-300x212.png 300w\" sizes=\"auto, (max-width: 373px) 100vw, 373px\" \/><\/figure>\n<\/div>\n<\/div>\n\n\n\n<p>Con Image Augmentation: <\/p>\n\n\n\n<div class=\"wp-block-columns is-layout-flex wp-container-core-columns-is-layout-9d6595d7 wp-block-columns-is-layout-flex\">\n<div class=\"wp-block-column is-layout-flow wp-block-column-is-layout-flow\">\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"386\" height=\"264\" src=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-43.png\" alt=\"\" class=\"wp-image-2450\" srcset=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-43.png 386w, https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-43-300x205.png 300w\" sizes=\"auto, (max-width: 386px) 100vw, 386px\" \/><figcaption>Image Augmentation<\/figcaption><\/figure>\n<\/div>\n\n\n\n<div class=\"wp-block-column is-layout-flow wp-block-column-is-layout-flow\">\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"380\" height=\"264\" src=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-44.png\" alt=\"\" class=\"wp-image-2451\" srcset=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-44.png 380w, https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-44-300x208.png 300w\" sizes=\"auto, (max-width: 380px) 100vw, 380px\" \/><figcaption>Image Augmentation<\/figcaption><\/figure>\n<\/div>\n<\/div>\n\n\n\n<p>Mejora los n\u00fameros del modelo simple, pero mantiene exactamente el mismo problema de Overfitting y reacciona igual a la soluci\u00f3n de usar Data Augmentation. <\/p>\n\n\n\n<p>En los dos modelos se aprecia una irregularidad en la curva de Loss. Una posible causa es el Learning Rate usado para el optimizador RMSprop que se ha usado. Se podr\u00eda crear una funci\u00f3n para identificar que learning rate puede ser mejor y usar el optimizador Adam para ver si se consigue una curva con menos estridencias.  <\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Con tres capas convolucionales y Dropout. <\/h4>\n\n\n\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"python\" data-enlighter-theme=\"\" data-enlighter-highlight=\"\" data-enlighter-linenumbers=\"\" data-enlighter-lineoffset=\"\" data-enlighter-title=\"\" data-enlighter-group=\"\">tf.keras.models.Sequential([\n            tf.keras.layers.Conv2D(16, (4,4), activation=\"relu\", input_shape=(150, 150, 3)),\n            tf.keras.layers.MaxPooling2D(2,2),\n            tf.keras.layers.Dropout(0.2),   \n            tf.keras.layers.Conv2D(32, (4,4), activation=\"relu\"),\n            tf.keras.layers.MaxPooling2D(2,2),  \n            tf.keras.layers.Dropout(0.2),  \n            tf.keras.layers.Conv2D(64, (4,4), activation=\"relu\"),\n            tf.keras.layers.MaxPooling2D(2,2),  \n            tf.keras.layers.Dropout(0.5), \n            tf.keras.layers.Flatten(), \n            tf.keras.layers.Dense(512, activation=\"relu\"), \n            tf.keras.layers.Dense(1, activation=\"sigmoid\")])<\/pre>\n\n\n\n<p>Se incorpora una capa de Dropout  d\u00e9spues de cada capa de MaxPooling2D. <\/p>\n\n\n\n<p>Resultados: <\/p>\n\n\n\n<p>85s 423ms\/step &#8211; loss: 0.3076 &#8211; accuracy: 0.8639 &#8211; val_loss: 0.3255 &#8211; val_accuracy: 0.8672<sup>Con Image Augmentation<\/sup>. <\/p>\n\n\n\n<div class=\"wp-block-columns is-layout-flex wp-container-core-columns-is-layout-9d6595d7 wp-block-columns-is-layout-flex\">\n<div class=\"wp-block-column is-layout-flow wp-block-column-is-layout-flow\">\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"380\" height=\"264\" src=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-45.png\" alt=\"\" class=\"wp-image-2452\" srcset=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-45.png 380w, https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-45-300x208.png 300w\" sizes=\"auto, (max-width: 380px) 100vw, 380px\" \/><figcaption>Image Augmentation<\/figcaption><\/figure>\n<\/div>\n\n\n\n<div class=\"wp-block-column is-layout-flow wp-block-column-is-layout-flow\">\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"380\" height=\"264\" src=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-46.png\" alt=\"\" class=\"wp-image-2453\" srcset=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-46.png 380w, https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-46-300x208.png 300w\" sizes=\"auto, (max-width: 380px) 100vw, 380px\" \/><figcaption>Image augmentation<\/figcaption><\/figure>\n<\/div>\n<\/div>\n\n\n\n<p>Solo he realizado entrenos con Data Augmentation. No se aprecia overfitting, pero la curva continua teniendo unos picos que tendr\u00edan que eliminarse, o reducirse. <\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Transfer Learning.  <\/h3>\n\n\n\n<p>He usado dos modelos preentrenados diferentes InceptionV3 y VGG16.  He usado dos t\u00e9cnicas diferentes para bajarme los pesos y crear el modelo. <\/p>\n\n\n\n<p>Con Transfer Learning lo que se hace es aprovechar modelos existentes que ya est\u00e1n entrenados. Se puede seleccionar el modelo completo, o tan solo las capas que queramos del modelo. Despu\u00e9s se complementa con nuestras capas finales, y entrenamos tan solo las capas que hemos incorporado. Con esto no se aprovecha tan solo la forma del modelo, que ya es mucho, sino que tambi\u00e9n aprovechamos el esfuerzo de entreno, tanto en horas como en datos que se ha realizado con el modelo pre entrenado. <\/p>\n\n\n\n<h4 class=\"wp-block-heading\"> Transfer Learning con InceptionV3<\/h4>\n\n\n\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"python\" data-enlighter-theme=\"\" data-enlighter-highlight=\"\" data-enlighter-linenumbers=\"\" data-enlighter-lineoffset=\"\" data-enlighter-title=\"\" data-enlighter-group=\"\">from tensorflow.keras import Model\n\n# Download the pre-trained weights. No top means it excludes the fully connected layer it uses for classification.\n!wget --no-check-certificate \\\n    https:\/\/storage.googleapis.com\/mledu-datasets\/inception_v3_weights_tf_dim_ordering_tf_kernels_notop.h5 \\\n    -O \/tmp\/inception_v3_weights_tf_dim_ordering_tf_kernels_notop.h5<\/pre>\n\n\n\n<p>Importamos Model de Keras, para crear el modelo. Nos bajamos los pesos del modelo, parta cargarlos al crear el modelo.<\/p>\n\n\n\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"python\" data-enlighter-theme=\"\" data-enlighter-highlight=\"\" data-enlighter-linenumbers=\"\" data-enlighter-lineoffset=\"\" data-enlighter-title=\"\" data-enlighter-group=\"\">#conver layers in non trainable. \ndef notrainlayers(model):\n    for layer in model.layers:\n        layer.trainable=False\n    return model  <\/pre>\n\n\n\n<p>Esta funci\u00f3n nos permite marcar c\u00f3mo no entrenables las capas del modelo que reciba. Al bajarnos un modelo pre entrenado, con sus pesos correspondientes no queremos volver a entrenar el modelo. Para ello marcamos las capas como entrenables. <\/p>\n\n\n\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"python\" data-enlighter-theme=\"\" data-enlighter-highlight=\"\" data-enlighter-linenumbers=\"\" data-enlighter-lineoffset=\"\" data-enlighter-title=\"\" data-enlighter-group=\"\">#import Inceptionv3. \nfrom tensorflow.keras.applications.inception_v3 import InceptionV3\n\n#create the model. \ninception_pre_trained=InceptionV3(input_shape=(150, 150, 3), \n                                 include_top=False, \n                                 weights=None)\n\n#store name of the file in a variable. \nlocal_weigth_file = '\/tmp\/inception_v3_weights_tf_dim_ordering_tf_kernels_notop.h5'\n#load the weights, obtained downloading \ninception_pre_trained.load_weights(local_weigth_file)<\/pre>\n\n\n\n<p>El modelo InceptionV3 esta precargado en la libreria keras, por lo que lo importamos directamente. <\/p>\n\n\n\n<p>Al crear el modelo con InceptionV3 le pasamos tres parametros: <\/p>\n\n\n\n<ul class=\"wp-block-list\"><li>El input shape. Que debe coincidir con la forma de los elementos de nuestro dataset. <\/li><li>Include_top = False para indicar que no queremos el clasificador del modelo, que usaremos el nuestro. <\/li><li>weigths=None. como hemos recuperado los pesos y los hemos guardado en un fichero local le indicamos que no queremos que los cargue. <\/li><\/ul>\n\n\n\n<p>Finalmente cargamos los pesos desde el fichero que hemos guardado. <\/p>\n\n\n\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"generic\" data-enlighter-theme=\"\" data-enlighter-highlight=\"\" data-enlighter-linenumbers=\"\" data-enlighter-lineoffset=\"\" data-enlighter-title=\"\" data-enlighter-group=\"\">==================================================================================================\nTotal params: 21,802,784\nTrainable params: 21,768,352\nNon-trainable params: 34,432\n<\/pre>\n\n\n\n<p>Al consultar el summary del modelo, al final podemos ver que tenemos casi 22 millones de par\u00e1metros entrenables. Esto cambiar\u00e1 porque primero,  vamos a marcarlas como no entrenables, y tamboen eliminaremos algunas. <\/p>\n\n\n\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"python\" data-enlighter-theme=\"\" data-enlighter-highlight=\"\" data-enlighter-linenumbers=\"\" data-enlighter-lineoffset=\"\" data-enlighter-title=\"\" data-enlighter-group=\"\">inception_pre_trained = notrainlayers(inception_pre_trained)<\/pre>\n\n\n\n<p>Para marcar las capas del modelo como no entrenables tan solo tenemos que pasarlo a la funci\u00f3n que hemos creado antes, que tan solo contiene un bucle que pasa por todas las capas del modelo que recibe y las marca como entrenables. <\/p>\n\n\n\n<p>Si despu\u00e9s de llamar a la funci\u00f3n llamamos al Summary del modelo veremos como los parametroa ahora son no entrenables. <\/p>\n\n\n\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"generic\" data-enlighter-theme=\"\" data-enlighter-highlight=\"\" data-enlighter-linenumbers=\"\" data-enlighter-lineoffset=\"\" data-enlighter-title=\"\" data-enlighter-group=\"\">==================================================================================================\nTotal params: 21,802,784\nTrainable params: 0\nNon-trainable params: 21,802,784<\/pre>\n\n\n\n<p>El modelo tiene una cantidad de capas inmensa, en el summary nos indica todas y podemos seleccionar una para realizar un corte. Ee decir quedarnos con esa capa y todas las previas. <\/p>\n\n\n\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"generic\" data-enlighter-theme=\"\" data-enlighter-highlight=\"\" data-enlighter-linenumbers=\"\" data-enlighter-lineoffset=\"\" data-enlighter-title=\"\" data-enlighter-group=\"\">.............. \nbatch_normalization_257 (Batch  (None, 7, 7, 192)   576         ['conv2d_289[0][0]']             \n Normalization)                                                                                   \n                                                                                                  \n activation_248 (Activation)    (None, 7, 7, 192)    0           ['batch_normalization_248[0][0]']\n                                                                                                  \n activation_251 (Activation)    (None, 7, 7, 192)    0           ['batch_normalization_251[0][0]']\n                                                                                                  \n activation_256 (Activation)    (None, 7, 7, 192)    0           ['batch_normalization_256[0][0]']\n                                                                                                  \n activation_257 (Activation)    (None, 7, 7, 192)    0           ['batch_normalization_257[0][0]']\n                                                                                                  \n mixed7 (Concatenate)           (None, 7, 7, 768)    0           ['activation_248[0][0]',         \n                                                                  'activation_251[0][0]',         \n                                                                  'activation_256[0][0]',         \n                                                                  'activation_257[0][0]']   \n...............<\/pre>\n\n\n\n<p>En este peque\u00f1a porci\u00f3n del modelo podemos ver la capa mixed7, que es la seleccionada como \u00faltima capa que nos interesa. <\/p>\n\n\n\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"python\" data-enlighter-theme=\"\" data-enlighter-highlight=\"\" data-enlighter-linenumbers=\"\" data-enlighter-lineoffset=\"\" data-enlighter-title=\"\" data-enlighter-group=\"\">#select the last layer we want from the pretrained model\nlast_layer = inception_pre_trained.get_layer('mixed7')\nlast_output = last_layer.output<\/pre>\n\n\n\n<p>Seleccionamos la \u00faltima capa que queremos, la guardamos en last_layer. Acto seguido se usa para obtener el output del modelo a partir de esa ultima capa. Ese output lo vamos a usa para continuar a\u00f1adiendo capas al modelo. <\/p>\n\n\n\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"python\" data-enlighter-theme=\"\" data-enlighter-highlight=\"\" data-enlighter-linenumbers=\"\" data-enlighter-lineoffset=\"\" data-enlighter-title=\"\" data-enlighter-group=\"\">#Flatten the output layer to 1 dimension\nflayers = tf.keras.layers.Flatten()(last_output)\n\n#add a fullly connected layer woth 512 neurons the samen that with the others models. \nflayers = tf.keras.layers.Dense(512, activation='relu')(flayers)\n\n#add a final sigmoid layer for binary classification\nflayers = tf.keras.layers.Dense(1, activation='sigmoid')(flayers)\n\n#append the final layers to the pretrained layer and create a new model\nmodelf = Model(inception_pre_trained.input, flayers)\n<\/pre>\n\n\n\n<p>Las layers las voy a ir almacenando en la variable <strong><em>flayers<\/em><\/strong> primero le pongo una capa de flatten, y fijaros que le a\u00f1ado (last_output) donde tengo el contenido del modelo anterior hasta la capa que he seleccionado como capa final. <\/p>\n\n\n\n<p>Despues le incorporo una capa Densa y acto seguido el clasificador. Quizas podria haber puesto alguna capa de Dropout, usar mas neurones, pero he preferido mantenerlo simple y con la misma estructura final de los modelos usados en el notebook. <\/p>\n\n\n\n<p>Finalmente con Model, creo el modelo nuevo que ya contiene  tanto la parte del modelo preentrenado que nos interesa como las capas que acabamos de incoporar. <\/p>\n\n\n\n<p>Ahora al consultar el summary del modelo acabado de crear podemos ver que ya tenemos par\u00e1metros entrenables. <\/p>\n\n\n\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"generic\" data-enlighter-theme=\"\" data-enlighter-highlight=\"\" data-enlighter-linenumbers=\"\" data-enlighter-lineoffset=\"\" data-enlighter-title=\"\" data-enlighter-group=\"\">........ \nmixed7 (Concatenate)           (None, 7, 7, 768)    0           ['activation_248[0][0]',         \n                                                                  'activation_251[0][0]',         \n                                                                  'activation_256[0][0]',         \n                                                                  'activation_257[0][0]']         \n                                                                                                  \n flatten_20 (Flatten)           (None, 37632)        0           ['mixed7[0][0]']                 \n                                                                                                  \n dense_36 (Dense)               (None, 512)          19268096    ['flatten_20[0][0]']             \n                                                                                                  \n dense_37 (Dense)               (None, 1)            513         ['dense_36[0][0]']               \n                                                                                                  \n==================================================================================================\nTotal params: 28,243,873\nTrainable params: 19,268,609\nNon-trainable params: 8,975,264<\/pre>\n\n\n\n<p>Tambi\u00e9n se puede ver c\u00f3mo el modelo finaliza con la capa mixed7 y las capas que le he incorporado. <\/p>\n\n\n\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"python\" data-enlighter-theme=\"\" data-enlighter-highlight=\"\" data-enlighter-linenumbers=\"\" data-enlighter-lineoffset=\"\" data-enlighter-title=\"\" data-enlighter-group=\"\">modelf.compile(loss=\"binary_crossentropy\", \n              optimizer='Adam', \n              metrics=['accuracy'])\n\nhistoryF = modelf.fit(\n     train_data,\n     validation_data = val_data, \n     epochs=gEpochs,\n     steps_per_epoch=len(train_data),\n     validation_steps=len(val_data),\n     verbose=1)<\/pre>\n\n\n\n<p>El modelo lo he compilado con el Optimizador <strong><em>Adam<\/em><\/strong> y la funci\u00f3n de perdida <strong><em>binary_crossentropy<\/em><\/strong>. <\/p>\n\n\n\n<pre class=\"wp-block-preformatted\">87s 436ms\/step - loss: 0.0649 - accuracy: 0.9752 - val_loss: 0.0831 - val_accuracy: 0.9690<\/pre>\n\n\n\n<div class=\"wp-block-columns is-layout-flex wp-container-core-columns-is-layout-9d6595d7 wp-block-columns-is-layout-flex\">\n<div class=\"wp-block-column is-layout-flow wp-block-column-is-layout-flow\">\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"380\" height=\"264\" src=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-47.png\" alt=\"\" class=\"wp-image-2456\" srcset=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-47.png 380w, https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-47-300x208.png 300w\" sizes=\"auto, (max-width: 380px) 100vw, 380px\" \/><\/figure>\n<\/div>\n\n\n\n<div class=\"wp-block-column is-layout-flow wp-block-column-is-layout-flow\">\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"380\" height=\"264\" src=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-48.png\" alt=\"\" class=\"wp-image-2457\" srcset=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-48.png 380w, https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-48-300x208.png 300w\" sizes=\"auto, (max-width: 380px) 100vw, 380px\" \/><\/figure>\n<\/div>\n<\/div>\n\n\n\n<p>El resultado realmente es bastante bueno y no se aprecia overfitting, quiz\u00e1s porque lo he entrenado con los datos que han pasado por el proceso de Image Augmentation. <\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Transfer learning desde el modelo VGG16. <\/h4>\n\n\n\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"python\" data-enlighter-theme=\"\" data-enlighter-highlight=\"\" data-enlighter-linenumbers=\"\" data-enlighter-lineoffset=\"\" data-enlighter-title=\"\" data-enlighter-group=\"\">from keras.applications.vgg16 import VGG16\n\n#https:\/\/storage.googleapis.com\/tensorflow\/keras-applications\/vgg16\/vgg16_weights_tf_dim_ordering_tf_kernels_notop.h5\nVGG16_pre_trained = VGG16(input_shape=(150, 150, 3), \n                       include_top=False, \n                       weights='imagenet')<\/pre>\n\n\n\n<p>Tambi\u00e9n se trata de un modelo que ya esta en la librer\u00eda keras, por el que el proceso de importaci\u00f3n es el mismo. Pero en este caso no me descargo los datos, sino que le indico en la creaci\u00f3n del modelo que los obtenga de imagenet. Es un standard de facto en los modelos de reconocimiento de imagenes. En este caso se podri\u00e1n dejar las cpas como entrenables para que adaptaran su peso, pero no considero que sea necesario., por lo que igual que en el caso anterior las marcare como no entrenables. <\/p>\n\n\n\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"python\" data-enlighter-theme=\"\" data-enlighter-highlight=\"\" data-enlighter-linenumbers=\"\" data-enlighter-lineoffset=\"\" data-enlighter-title=\"\" data-enlighter-group=\"\">VGG16_pre_trained = notrainlayers(VGG16_pre_trained)\n\nmodelVGG = tf.keras.models.Sequential()\nmodelVGG.add(VGG16_pre_trained)\n\n#Flatten the output layer to 1 dimension\nmodelVGG.add(tf.keras.layers.Flatten())\n\n#add a fullly connected layer woth 512 neurons the samen that with the others models. \nmodelVGG.add(tf.keras.layers.Dense(512, activation='relu'))\n\n#add a final sigmoid layer for binary classification\n#flayersV = tf.keras.layers.Dense(1, activation='sigmoid')(flayers)\nmodelVGG.add(tf.keras.layers.Dense(1, activation='sigmoid'))\n\nmodelVGG.summary()<\/pre>\n\n\n\n<p>La forma de incorporar las capas tambi\u00e9n es diferente. He creado un modelo secuencial y he a\u00f1adido el modelo pre entrenado, a partir de aqu\u00ed se incorporan las capas como si se tratar\u00e1 de un modelo normal y corriente. <\/p>\n\n\n\n<pre class=\"wp-block-preformatted\">Model: \"sequential_17\"\n_________________________________________________________________\n Layer (type)                Output Shape              Param #   \n=================================================================\n vgg16 (Functional)          (None, 4, 4, 512)         14714688  \n                                                                 \n flatten_32 (Flatten)        (None, 8192)              0         \n                                                                 \n dense_54 (Dense)            (None, 512)               4194816   \n                                                                 \n dense_55 (Dense)            (None, 1)                 513       \n                                                                 \n=================================================================\nTotal params: 18,910,017\nTrainable params: 4,195,329\nNon-trainable params: 14,714,688<\/pre>\n\n\n\n<p> Como se puede ver la mayor\u00eda de par\u00e1metros no son entrenables. <\/p>\n\n\n\n<pre class=\"wp-block-preformatted\">174s 870ms\/step - loss: 0.2018 - accuracy: 0.9140 - val_loss: 0.2243 - val_accuracy: 0.9052<\/pre>\n\n\n\n<p>El modelo funciona bastante bien, pero no tanto como el InceptionV3. <\/p>\n\n\n\n<div class=\"wp-block-columns is-layout-flex wp-container-core-columns-is-layout-9d6595d7 wp-block-columns-is-layout-flex\">\n<div class=\"wp-block-column is-layout-flow wp-block-column-is-layout-flow\">\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"380\" height=\"264\" src=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-49.png\" alt=\"\" class=\"wp-image-2461\" srcset=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-49.png 380w, https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-49-300x208.png 300w\" sizes=\"auto, (max-width: 380px) 100vw, 380px\" \/><\/figure>\n<\/div>\n\n\n\n<div class=\"wp-block-column is-layout-flow wp-block-column-is-layout-flow\">\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"380\" height=\"264\" src=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-50.png\" alt=\"\" class=\"wp-image-2462\" srcset=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-50.png 380w, https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/image-50-300x208.png 300w\" sizes=\"auto, (max-width: 380px) 100vw, 380px\" \/><\/figure>\n<\/div>\n<\/div>\n\n\n\n<h3 class=\"wp-block-heading\">Resumen de lo visto por ahora. <\/h3>\n\n\n\n<p>Creo que con este segundo notebook queda cubierto el tema de clasificaci\u00f3n de im\u00e1genes. <\/p>\n\n\n\n<ul class=\"wp-block-list\"><li>He utilizado un dataset desde disco, en lugar de uno obtenido desde Tensorflow. <\/li><li>Era un sistema de clasificaci\u00f3n binario, en lugar de varias categor\u00edas. <\/li><li>Hay dos ejemplos de c\u00f3mo usar Transfer learning. <\/li><\/ul>\n\n\n\n<p>Dejo aqu\u00ed el articulo anterior y creo que ya se puede cerrar el tema de redes convolucionales y clasificaci\u00f3n de im\u00e1genes. <\/p>\n\n\n\n<figure class=\"wp-block-embed is-type-wp-embed is-provider-pere-martra wp-block-embed-pere-martra\"><div class=\"wp-block-embed__wrapper\">\n<blockquote class=\"wp-embedded-content\" data-secret=\"F3cop873hC\"><a href=\"https:\/\/martra.uadla.com\/preparando-la-certificacion-tensorflow-developer-by-google-1-image-clasification\/\">Preparando  la certificaci\u00f3n TensorFlow Developer by Google. 1-Image Clasification.<\/a><\/blockquote><iframe loading=\"lazy\" class=\"wp-embedded-content\" sandbox=\"allow-scripts\" security=\"restricted\" style=\"position: absolute; visibility: hidden;\" title=\"\u00abPreparando  la certificaci\u00f3n TensorFlow Developer by Google. 1-Image Clasification.\u00bb \u2014 Pere Martra\" src=\"https:\/\/martra.uadla.com\/preparando-la-certificacion-tensorflow-developer-by-google-1-image-clasification\/embed\/#?secret=r7jAlxT0Xm#?secret=F3cop873hC\" data-secret=\"F3cop873hC\" width=\"600\" height=\"338\" frameborder=\"0\" marginwidth=\"0\" marginheight=\"0\" scrolling=\"no\"><\/iframe>\n<\/div><\/figure>\n\n\n\n<p>El siguiente noteboook ser\u00e1 sobre Natural Language Processing. Mas concretamente la parte de an\u00e1lisis del sentimiento usando supervised learning. <\/p>\n  <div class=\"related-post grid\">\r\n      <div class=\"post-list \">\r\n\r\n            <div class=\"item\">\r\n          \r\n  <a class=\"title post_title\"  title=\"Preparando la certificaci\u00f3n Tensorflow Developer by Google. 3-NLP Binary \/ Multi classification.\" href=\"https:\/\/martra.uadla.com\/preparando-la-certificacion-tensorflow-developer-by-google-3-nlp-binary-multi-classification\/?related_post_from=2468\">\r\n        Preparando la certificaci\u00f3n Tensorflow Developer by Google. 3-NLP Binary \/ Multi classification.  <\/a>\r\n\r\n  <div class=\"thumb post_thumb\">\r\n    <a  title=\"Preparando la certificaci\u00f3n Tensorflow Developer by Google. 3-NLP Binary \/ Multi classification.\" href=\"https:\/\/martra.uadla.com\/preparando-la-certificacion-tensorflow-developer-by-google-3-nlp-binary-multi-classification\/?related_post_from=2468\">\r\n\r\n      <img loading=\"lazy\" decoding=\"async\" width=\"1080\" height=\"640\" src=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/PortadaTFC3.jpg\" class=\"attachment-full size-full wp-post-image\" alt=\"\" srcset=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/PortadaTFC3.jpg 1080w, https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/PortadaTFC3-300x178.jpg 300w, https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/PortadaTFC3-1024x607.jpg 1024w, https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/07\/PortadaTFC3-768x455.jpg 768w\" sizes=\"auto, (max-width: 1080px) 100vw, 1080px\" \/>\r\n\r\n    <\/a>\r\n  <\/div>\r\n  <p class=\"excerpt post_excerpt\">\r\n    Explico los notebooks de clasificaci\u00f3n binaria y m\u00faltiple de sentimiendos en texto (NLP) usando diversos modelos para preparar la certificaci\u00f3n <a class=\"read-more\" href=\"https:\/\/martra.uadla.com\/preparando-la-certificacion-tensorflow-developer-by-google-3-nlp-binary-multi-classification\/?related_post_from=2468\"> Read more<\/a>  <\/p>\r\n        <\/div>\r\n              <div class=\"item\">\r\n          \r\n  <a class=\"title post_title\"  title=\"Instalamos el entorno de IA y creamos un primer proyecto de ML con SciKit-Learn.\" href=\"https:\/\/martra.uadla.com\/instalamos-el-entorno-de-ia-y-creamos-un-primer-proyecto-de-ml-con-scikit-learn\/?related_post_from=2272\">\r\n        Instalamos el entorno de IA y creamos un primer proyecto de ML con SciKit-Learn.  <\/a>\r\n\r\n  <div class=\"thumb post_thumb\">\r\n    <a  title=\"Instalamos el entorno de IA y creamos un primer proyecto de ML con SciKit-Learn.\" href=\"https:\/\/martra.uadla.com\/instalamos-el-entorno-de-ia-y-creamos-un-primer-proyecto-de-ml-con-scikit-learn\/?related_post_from=2272\">\r\n\r\n      <img loading=\"lazy\" decoding=\"async\" width=\"1080\" height=\"640\" src=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/04\/cursoml1.png\" class=\"attachment-full size-full wp-post-image\" alt=\"\" srcset=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/04\/cursoml1.png 1080w, https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/04\/cursoml1-300x178.png 300w, https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/04\/cursoml1-1024x607.png 1024w, https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/04\/cursoml1-768x455.png 768w\" sizes=\"auto, (max-width: 1080px) 100vw, 1080px\" \/>\r\n\r\n    <\/a>\r\n  <\/div>\r\n  <p class=\"excerpt post_excerpt\">\r\n    Aqu\u00ed tenemos la primera lecci\u00f3n del curso pr\u00e1ctico de IA sin prerrequisitos. El v\u00eddeo en el que se sustenta la <a class=\"read-more\" href=\"https:\/\/martra.uadla.com\/instalamos-el-entorno-de-ia-y-creamos-un-primer-proyecto-de-ml-con-scikit-learn\/?related_post_from=2272\"> Read more<\/a>  <\/p>\r\n        <\/div>\r\n              <div class=\"item\">\r\n          \r\n  <a class=\"title post_title\"  title=\"Instalar anaconda en MAC OS Catalina\" href=\"https:\/\/martra.uadla.com\/instalar-anaconda-en-mac-os-catalina\/?related_post_from=1950\">\r\n        Instalar anaconda en MAC OS Catalina  <\/a>\r\n\r\n  <div class=\"thumb post_thumb\">\r\n    <a  title=\"Instalar anaconda en MAC OS Catalina\" href=\"https:\/\/martra.uadla.com\/instalar-anaconda-en-mac-os-catalina\/?related_post_from=1950\">\r\n\r\n      <img loading=\"lazy\" decoding=\"async\" width=\"321\" height=\"161\" src=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2020\/06\/Captura-de-pantalla-2020-06-10-a-las-23.12.35-e1595277466402.png\" class=\"attachment-full size-full wp-post-image\" alt=\"\" \/>\r\n\r\n    <\/a>\r\n  <\/div>\r\n  <p class=\"excerpt post_excerpt\">\r\n    \u00bfTe falla la instalaci\u00f3n de Conda en MacOs Catalina? A mi tamb\u00eden me ha pasado... y lo he solucionado modificando <a class=\"read-more\" href=\"https:\/\/martra.uadla.com\/instalar-anaconda-en-mac-os-catalina\/?related_post_from=1950\"> Read more<\/a>  <\/p>\r\n        <\/div>\r\n              <div class=\"item\">\r\n          \r\n  <a class=\"title post_title\"  title=\"Graph Mode vs Eager Mode en TensorFlow. Mejorando el rendimiento.\" href=\"https:\/\/martra.uadla.com\/graph-mode-vs-eager-mode-en-tensorflow-mejorando-el-rendimiento\/?related_post_from=2565\">\r\n        Graph Mode vs Eager Mode en TensorFlow. Mejorando el rendimiento.  <\/a>\r\n\r\n  <div class=\"thumb post_thumb\">\r\n    <a  title=\"Graph Mode vs Eager Mode en TensorFlow. Mejorando el rendimiento.\" href=\"https:\/\/martra.uadla.com\/graph-mode-vs-eager-mode-en-tensorflow-mejorando-el-rendimiento\/?related_post_from=2565\">\r\n\r\n      <img loading=\"lazy\" decoding=\"async\" width=\"2560\" height=\"1707\" src=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/11\/mathew-schwartz-P-WWHRF7qe0-unsplash-scaled.jpg\" class=\"attachment-full size-full wp-post-image\" alt=\"\" srcset=\"https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/11\/mathew-schwartz-P-WWHRF7qe0-unsplash-scaled.jpg 2560w, https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/11\/mathew-schwartz-P-WWHRF7qe0-unsplash-300x200.jpg 300w, https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/11\/mathew-schwartz-P-WWHRF7qe0-unsplash-1024x683.jpg 1024w, https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/11\/mathew-schwartz-P-WWHRF7qe0-unsplash-768x512.jpg 768w, https:\/\/martra.uadla.com\/wp-content\/uploads\/2022\/11\/mathew-schwartz-P-WWHRF7qe0-unsplash-1536x1024.jpg 1536w\" sizes=\"auto, (max-width: 2560px) 100vw, 2560px\" \/>\r\n\r\n    <\/a>\r\n  <\/div>\r\n  <p class=\"excerpt post_excerpt\">\r\n    Veremos lo impresionantemente sencillo que puede ser obtener mejoras de rendimiento significativas usando la generaci\u00f3n autom\u00e1tica de c\u00f3digo en Graph <a class=\"read-more\" href=\"https:\/\/martra.uadla.com\/graph-mode-vs-eager-mode-en-tensorflow-mejorando-el-rendimiento\/?related_post_from=2565\"> Read more<\/a>  <\/p>\r\n        <\/div>\r\n      \r\n  <\/div>\r\n\r\n  <script>\r\n      <\/script>\r\n  <style>\r\n    .related-post {}\r\n\r\n    .related-post .post-list {\r\n      text-align: left;\r\n          }\r\n\r\n    .related-post .post-list .item {\r\n      margin: 10px;\r\n      padding: 0px;\r\n          }\r\n\r\n    .related-post .headline {\r\n      font-size: 18px !important;\r\n      color: #999999 !important;\r\n          }\r\n\r\n    .related-post .post-list .item .post_title {\r\n      font-size: 16px;\r\n      color: #3f3f3f;\r\n      margin: 10px 0px;\r\n      padding: 0px;\r\n      display: block;\r\n      text-decoration: none;\r\n          }\r\n\r\n    .related-post .post-list .item .post_thumb {\r\n      max-height: 220px;\r\n      margin: 10px 0px;\r\n      padding: 0px;\r\n      display: block;\r\n          }\r\n\r\n    .related-post .post-list .item .post_excerpt {\r\n      font-size: 13px;\r\n      color: #3f3f3f;\r\n      margin: 10px 0px;\r\n      padding: 0px;\r\n      display: block;\r\n      text-decoration: none;\r\n          }\r\n\r\n    @media only screen and (min-width: 1024px) {\r\n      .related-post .post-list .item {\r\n        width: 45%;\r\n      }\r\n    }\r\n\r\n    @media only screen and (min-width: 768px) and (max-width: 1023px) {\r\n      .related-post .post-list .item {\r\n        width: 90%;\r\n      }\r\n    }\r\n\r\n    @media only screen and (min-width: 0px) and (max-width: 767px) {\r\n      .related-post .post-list .item {\r\n        width: 90%;\r\n      }\r\n    }\r\n\r\n      <\/style>\r\n    <\/div>\r\n","protected":false},"excerpt":{"rendered":"<p>En el primer post de preparar la certificaci\u00f3n de TensorFlow Developer, vimos el notebook preparado para solucionar un problema de clasificaci\u00f3n de im\u00e1genes multiples usando el dataset Fashion MNIST que viene con Tensorflow. En el notebook actual voy a usar un Dataset muy conocido, el de gatos y perros de Microsoft, opara solucionar un problema <a class=\"read-more\" href=\"https:\/\/martra.uadla.com\/curso-practico-de-ia-sin-prerrequisitos\/\">LEER M\u00c1S<\/a><\/p>\n","protected":false},"author":1,"featured_media":2466,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[211,166,213],"tags":[],"class_list":["post-2439","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-inteligencia-artificial","category-machine-learning","category-tensorflow-developer-certificate"],"_links":{"self":[{"href":"https:\/\/martra.uadla.com\/wp-json\/wp\/v2\/posts\/2439","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/martra.uadla.com\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/martra.uadla.com\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/martra.uadla.com\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/martra.uadla.com\/wp-json\/wp\/v2\/comments?post=2439"}],"version-history":[{"count":5,"href":"https:\/\/martra.uadla.com\/wp-json\/wp\/v2\/posts\/2439\/revisions"}],"predecessor-version":[{"id":2464,"href":"https:\/\/martra.uadla.com\/wp-json\/wp\/v2\/posts\/2439\/revisions\/2464"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/martra.uadla.com\/wp-json\/wp\/v2\/media\/2466"}],"wp:attachment":[{"href":"https:\/\/martra.uadla.com\/wp-json\/wp\/v2\/media?parent=2439"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/martra.uadla.com\/wp-json\/wp\/v2\/categories?post=2439"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/martra.uadla.com\/wp-json\/wp\/v2\/tags?post=2439"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}