Saltar a contenido

Jupyter Notebook

"Clase de la hoja"

########################################################################################################################################################################################################################################################## Copiar todos los comandos
########################################################################################################################################################################################################################################################## Generar PDF seleccionado/button

■/div titulada

Atajos y flujos de trabajo para la ciencia de datos y el cálculo interactivo.

Shortcut Mode Description
Enter Command Enter Edit Mode
Esc Edit Enter Command Mode
Shift+Enter Both Run Cell and Select Below
Ctrl+Enter Both Run Cell
Alt+Enter Both Run Cell and Insert Below
↑/↓ Command Select Cell Above/Below
A Command Insert Cell Above
B Command Insert Cell Below
X Command Cut Cell
C Command Copy Cell
V Command Paste Cell Below
Shift+V Command Paste Cell Above
DD Command Delete Cell
Z Command Undo Cell Deletion

Operaciones celulares

Shortcut Mode Description
M Command Change to Markdown Cell
Y Command Change to Code Cell
R Command Change to Raw Cell
1-6 Command Change to Heading 1-6
Shift+M Command Merge Selected Cells
Ctrl+Shift+- Edit Split Cell at Cursor
Shift+J/K Command Extend Selection Below/Above
Shift+↑/↓ Command Extend Selection

Edición del Código

Shortcut Mode Description
Tab Edit Code Completion or Indent
Shift+Tab Edit Tooltip
Ctrl+] Edit Indent
Ctrl+[ Edit Dedent
Ctrl+A Edit Select All
Ctrl+Z Edit Undo
Ctrl+Shift+Z Edit Redo
Ctrl+Y Edit Redo
Ctrl+Home Edit Go to Cell Start
Ctrl+End Edit Go to Cell End
Ctrl+Left/Right Edit Go Left/Right One Word
Ctrl+Backspace Edit Delete Word Before
Ctrl+Delete Edit Delete Word After

Código de ejecución

Shortcut Mode Description
Shift+Enter Both Run Cell, Select Below
Ctrl+Enter Both Run Cell
Alt+Enter Both Run Cell, Insert Below
Ctrl+K Command Interrupt Kernel
0,0 Command Restart Kernel
Shift+L Command Toggle Line Numbers
Shift+O Command Toggle Output

Operaciones de archivo

Shortcut Mode Description
Ctrl+S Both Save and Checkpoint
Ctrl+Shift+S Command Save As
Ctrl+O Command Open
Ctrl+N Command New Notebook
Ctrl+Shift+P Command Command Palette

Vista y diseño

Shortcut Mode Description
Shift+Space Command Scroll Up
Space Command Scroll Down
Ctrl+Shift+L Command Toggle All Line Numbers
F Command Find and Replace
O Command Toggle Output
Shift+O Command Toggle Output Scrolling

Mandamientos mágicos

Command Description
%run script.py Run Python script
%load script.py Load script into cell
%who List variables
%whos List variables with details
%time statement Time execution of statement
%timeit statement Time execution multiple times
%matplotlib inline Enable inline plots
%pwd Print working directory
%cd directory Change directory
%ls List directory contents
%history Show command history
%reset Reset namespace
%debug Enter debugger
%pdb on/off Toggle automatic debugger

Comandos Mágicos Celulares

Command Description
%%time Time execution of entire cell
%%timeit Time execution of cell multiple times
%%bash Run cell as bash script
%%html Render cell as HTML
%%javascript Run cell as JavaScript
%%latex Render cell as LaTeX
%%markdown Render cell as Markdown
%%python2 Run cell with Python 2
%%python3 Run cell with Python 3
%%writefile filename Write cell contents to file

Data Science Workflows

Carga de datos y exploración

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# Load data
df = pd.read_csv('data.csv')

# Quick exploration
df.head()
df.info()
df.describe()
df.shape

Visualización de datos

# Matplotlib inline
%matplotlib inline

# Basic plots
plt.figure(figsize=(10, 6))
plt.plot(x, y)
plt.title('Title')
plt.xlabel('X Label')
plt.ylabel('Y Label')
plt.show()

# Seaborn plots
sns.scatterplot(data=df, x='col1', y='col2')
sns.heatmap(df.corr(), annot=True)

Pipeline de aprendizaje automático

from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error

# Prepare data
X = df[['feature1', 'feature2']]
y = df['target']

# Split data
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

# Train model
model = LinearRegression()
model.fit(X_train, y_train)

# Evaluate
predictions = model.predict(X_test)
mse = mean_squared_error(y_test, predictions)

Formato de marcado

Headers

# Header 1
## Header 2
### Header 3
#### Header 4
##### Header 5
###### Header 6

Formato de texto

**Bold text**
*Italic text*
`Code text`
~~Strikethrough~~

Listas

- Unordered list item 1
- Unordered list item 2

1. Ordered list item 1
2. Ordered list item 2

Enlaces e imágenes

[Link text](URL)
![Alt text](image_url)

Cuadros

|Column 1|Column 2|Column 3|
|----------|----------|----------|
|Row 1|Data|Data|
|Row 2|Data|Data|

Matemáticas (LaTeX)

Inline math: $E = mc^2$

Block math:
$\int_\\\\{-\infty\\\\}^\\\\{\infty\\\\} e^\\\\{-x^2\\\\} dx = \sqrt\\\\{\pi\\\\}$

Buenas prácticas

Code Organization

  • Use nombres variables significativos
  • Agregar comentarios y documentos
  • Rompe operaciones complejas en múltiples células
  • Funciones de uso para operaciones repetidas
  • Importar bibliotecas en la parte superior

Análisis de datos

  1. Carga de datos: Importación y exploración inicial
  2. ** Limpieza de datos**: Manija los valores perdidos, los outliers
  3. Análisis de datos explicativos: Visualizaciones y estadísticas
  4. Ingeniería de alimentación: Crear nuevas características
  5. Modelos: Entrenar y evaluar modelos
  6. Resultados: Interpretar y visualizar resultados

Consejos de rendimiento

  • Utilizar operaciones vectoriales con NumPy/Pandas
  • Evite los bucles cuando sea posible
  • Utilizar tipos de datos apropiados
  • Producción clara de células grandes
  • Reinicie el núcleo periódicamente

Documentación

  • Use células de marcado para explicaciones
  • Hipótesis y decisiones de los documentos
  • Incluir información de la fuente de datos
  • Agregar conclusiones y próximos pasos
  • Use cabeceras de sección claras