Générer du texte avec l'intelligence artificielle GPT-2 de Google Colab Python

Le générateur de texte GPT-2, est un modèle d'intelligence artificielle créé par OpenAI qui est une société de recherche en intelligence artificielle à but non lucratif dont l'objectif est de promouvoir et de développer une intelligence artificielle conviviale de manière à ce qu'elle profite à l'ensemble de l'humanité. Le modèle gpt-2 possède un modèle entraîné pour générer du texte programmé dans le langage pyhton. Python est un langage populaire pour sa syntaxe.

Le but du programme est d'écrire et de générer automatiquement du texte sur la base d'un exemple que nous écrivons. Il va donc commencer à écrire une série de mots en fonction de ce qu'il pense et cette prédiction constituera le texte. Si nous lisons le texte, nous pouvons voir qu'il est cohérent avec ce qu'il dit.

Pour commencer à générer du texte, suivez les étapes ci-dessous.

1 - Nous installons les bibliothèques tensorielles Flow pour que les réseaux neuronaux fonctionnent correctement.

1TP5Bibliothèques gpu Tensorflow
!pip install tensorflow-gpu==1.15.0

2.- Nous avons configuré notre Google drive pour y enregistrer les données d'entraînement.
Lorsque nous exécutons cette commande, il nous demandera la permission d'accéder à notre lecteur Google et nous l'acceptons simplement.

from google.colab import drive
drive.mount('/content/drive')

3 - Nous téléchargeons GTP-2 depuis GitHub pour pouvoir utiliser le modèle avec les bibliothèques.

# exécuté une seule fois
# Créer le dossier gpt-2
/content/drive/My Drive/
!mkdir gpt-2
gpt-2/
!git clone https://github.com/openai/gpt-2.git
cd gpt-2

Naviguez vers le chemin où se trouve le gpt-2 que nous avons cloné sur notre disque.

# Changement de la version de tensorflow
/content/drive/MyDrive/gpt-2/gpt-2

5.- Nous sélectionnons la version 1 de tensorflow afin de pouvoir exécuter le programme.

%tensorflow_version 1.x

6.- Nous installons les exigences de pip3 afin de pouvoir utiliser les fichiers textes.

!pip3 install -r exigences.txt

7.- Nous visualisons ce qui se trouve à l'intérieur de la route vers laquelle nous naviguons.

!dir

Le texte suivant devrait apparaître dans le terminal.
CONTRIBUTORS.md Dockerfile.gpu LICENSE README.md

DEVELOPPEURS.md domaines.txt carte_modèle.md exigences.txt

Dockerfile.cpu download_model.py models src

8.- Sélectionnez un modèle, chaque modèle est différent donc nous devons considérer le poids du stockage si nous voulons télécharger l'un des 4 simplement enlever le symbole # car il est configuré pour ne pas télécharger tous et seulement télécharger celui que nous voulons et pour exécuter la console ignorer sauf celui que nous voulons télécharger.

!python3 download_model.py 124M
#!python3 download_model.py 355M
#!python3 download_model.py 774M
#!python3 download_model.py 1558M

10.- Modifiez le fichier interactive-conditional-samples.py en double cliquant dessus, le code est sur le côté gauche.

9.- Avant de générer le texte, nous devons exécuter la commande ; pour l'exécuter, nous devons modifier le modèle que nous avons téléchargé afin qu'il puisse le prendre en compte.
Nous allons dans notre projet colab et sur le côté gauche nous allons dans les dossiers de navigation. ?contenu/drive/MyDrive/gpt-2/gpt-2/gpt-2/src/interactive-conditional-samples.py ?

10.- Modifiez le fichier interactive-conditional-samples.py en double cliquant dessus, le code est sur le côté gauche.

Et maintenant nous cherchons les lignes de commande suivantes dans le code à partir de la ligne 11

def interact_model(

model_name='124M', //il appartient au modèle que nous avons téléchargé lorsque nous téléchargeons le 124M nous mettons celui-là, mais si nous téléchargeons le 355M, 774M ou 1558M nous le remplaçons simplement par '124M' A ?774M ?

seed=None,

nsamples=1, //nombre d'exemples que nous voulons tirer du texte

batch_size=1,

length=None, //nous définissons la longueur en mots None est la valeur par défaut mais nous pouvons mettre 1000 mots ou autant que nous voulons en remplaçant simplement par None.

température=1,

top_k=0,

top_p=1,

models_dir='models', //dossier où se trouvent les modèles téléchargés

):

11.- Maintenant, nous n'exécutons que la dernière ligne de code.

!python3 src/interactive_conditional_samples.py --top_k 40

 

Enfin, pour générer du texte, nous attendons quelque chose de similaire à ceci :

Là où il est écrit "Write a Text", il sera en anglais, je l'ai modifié pour qu'il soit en espagnol, maintenant nous écrivons ce que nous voulons qu'il génère en anglais, donc je vais dire

Qu'est-ce qu'un ordinateur ? ---- et appuyez sur la touche Entrée

Nous attendons quelques minutes et un texte apparaît, il suffit de le copier et de le coller dans le traducteur de Google.

Texte généré par GTP-2 à partir de Google Colab

Pour répondre à cette question, nous devons comprendre certains faits fondamentaux concernant le développement et le développement de logiciels.

Développement de logiciels

Il est courant que des personnes créent leur propre entreprise lorsqu'elles pensent être prêtes à le faire. Dans de nombreux pays différents, il existe un petit groupe de personnes qui veulent devenir les fondateurs de l'entreprise, mais qui ne sont pas nécessairement prêtes à devenir la personne qui la dirige (ce n'est pas une mauvaise chose si vous travaillez sur votre propre entreprise). Si vous voulez devenir le PDG d'une entreprise et que vous voulez travailler sur les idées ou les produits de votre entreprise, vous devez avoir une base vraiment solide dans votre carrière et vous devez être capable de garder vos idées et vos idées pertinentes pour vous .....

Pour vous donner une idée des principes du développement de logiciels, vous devez savoir :

C'est très utile car, dans un groupe, les idées, les concepts et les bases sont généralement autonomes et vous disposez d'une base solide. Mais lorsque vous avez affaire à deux groupes de personnes différents, vous pouvez commencer par deux personnes et ne pas vraiment être en mesure de les relier.

L'autre chose importante à savoir est : qu'est-ce qui fonctionne vraiment ?

Prenons un exemple simple comme "Je vais partager mes expériences" qui fonctionne pour une entreprise. Nous n'allons pas prendre en compte le nombre de personnes qui ont eu cette idée. En tant que groupe, nous allons créer un nouveau site web pour avoir plus d'utilisateurs que nos concurrents parce que nous avons un solide réseau d'utilisateurs. Si nous commençons avec un petit groupe, il faudra environ 20 utilisateurs, avec un noyau de 200, nous ne pourrons pas en créer un autre, avec un groupe de 50, nous ne pourrons pas créer un bon produit, et si nous commençons avec 20 équipes qui réussiront toutes, nous pourrons augmenter de 100 personnes par notre propre effort et ne pas avoir à faire face à la concurrence du tout.

Si vous êtes une société de logiciels et que vous devez créer un nouveau site web, vous voulez commencer par quelques idées plutôt que de vous contenter des 500 premiers utilisateurs que chacun de nos concurrents devra développer.

Qu'en est-il des nouvelles idées de produits, en particulier celles qui seront partagées avec les utilisateurs ? Nous n'en discuterons pas pour leur montrer l'impact de l'idée, nos concurrents n'essaieront pas de partager le produit, nous nous attacherons à essayer de comprendre la nouvelle idée plutôt que les personnes.

Comment trouver un groupe de personnes dont les intérêts sont les mêmes et qui sont prêtes à...

PROJET LINK :

https://colab.research.google.com/drive/1si8qWwcmUzA1HsPefLswNqgIsrti7BDo#scrollTo=rbpy2zDtIKnf

 

VOUS POUVEZ ÉGALEMENT ÊTRE INTÉRESSÉ À LIRE : QUI EST L'UNITÉ CENTRALE DE TRAITEMENT (POSTE CRÉÉ AVEC CE MODÈLE)

Laisser un commentaire

Monter

Les cookies de ce site web sont utilisés pour personnaliser le contenu et les publicités, fournir des fonctionnalités de médias sociaux et analyser le trafic. Plus d'informations

fr_FRFrench