import gstlearn as gl
import gstlearn.plot as gp
import gstlearn.document as gdoc
import matplotlib.pyplot as plt
import numpy as np
import os

gdoc.setNoScroll()

temp_csv = gdoc.loadData("Scotland", "Scotland_Temperatures.csv")

import pandas as pd
datcsv = pd.read_csv(temp_csv, na_values="MISS")
datcsv

dat = gl.Db_fromPandas(datcsv)
dat

Data Base Characteristics
=========================

Data Base Summary
-----------------
File is organized as a set of isolated points
Space dimension              = 0
Number of Columns            = 4
Total number of samples      = 236

Variables
---------
Column = 0 - Name = Longitude - Locator = NA
Column = 1 - Name = Latitude - Locator = NA
Column = 2 - Name = Elevation - Locator = NA
Column = 3 - Name = January_temp - Locator = NA

csv = gl.CSVformat.create(flagHeader=True, naString = "MISS")
dat = gl.Db.createFromCSV(temp_csv, csv=csv)
dat

Data Base Characteristics
=========================

Data Base Summary
-----------------
File is organized as a set of isolated points
Space dimension              = 0
Number of Columns            = 5
Total number of samples      = 236

Variables
---------
Column = 0 - Name = rank - Locator = NA
Column = 1 - Name = Longitude - Locator = NA
Column = 2 - Name = Latitude - Locator = NA
Column = 3 - Name = Elevation - Locator = NA
Column = 4 - Name = January_temp - Locator = NA

temp_nf = gdoc.loadData("Scotland", "Scotland_Temperatures.NF")
dat = gl.Db.createFromNF(temp_nf)
dat

Data Base Characteristics
=========================

Data Base Summary
-----------------
File is organized as a set of isolated points
Space dimension              = 2
Number of Columns            = 5
Total number of samples      = 236

Variables
---------
Column = 0 - Name = rank - Locator = NA
Column = 1 - Name = Longitude - Locator = x1
Column = 2 - Name = Latitude - Locator = x2
Column = 3 - Name = Elevation - Locator = NA
Column = 4 - Name = January_temp - Locator = z1

dat.display()

Data Base Characteristics
=========================

Data Base Summary
-----------------
File is organized as a set of isolated points
Space dimension              = 2
Number of Columns            = 5
Total number of samples      = 236

Variables
---------
Column = 0 - Name = rank - Locator = NA
Column = 1 - Name = Longitude - Locator = x1
Column = 2 - Name = Latitude - Locator = x2
Column = 3 - Name = Elevation - Locator = NA
Column = 4 - Name = January_temp - Locator = z1

dbfmt = gl.DbStringFormat.createFromFlags(flag_stats=True, names=["Elevation", "January_temp"])
dat.display(dbfmt)

Data Base Characteristics
=========================

Data Base Summary
-----------------
File is organized as a set of isolated points
Space dimension              = 2
Number of Columns            = 5
Total number of samples      = 236

Data Base Statistics
--------------------
4 - Name Elevation - Locator NA
 Nb of data          =        236
 Nb of active values =        236
 Minimum value       =      2.000
 Maximum value       =    800.000
 Mean value          =    146.441
 Standard Deviation  =    165.138
 Variance            =  27270.713
5 - Name January_temp - Locator z1
 Nb of data          =        236
 Nb of active values =        151
 Minimum value       =      0.600
 Maximum value       =      5.200
 Mean value          =      2.815
 Standard Deviation  =      1.010
 Variance            =      1.020

Variables
---------
Column = 0 - Name = rank - Locator = NA
Column = 1 - Name = Longitude - Locator = x1
Column = 2 - Name = Latitude - Locator = x2
Column = 3 - Name = Elevation - Locator = NA
Column = 4 - Name = January_temp - Locator = z1

gl.dbStatisticsMono(dat,
                     names=["Elevation", "January_temp"],
                     opers=gl.EStatOption.fromKeys(["MEAN","MINI","MAXI"]))

                   Mean    Minimum    Maximum
   Elevation     87.974      3.000    387.000
January_temp      2.815      0.600      5.200

print(dat[:])

[[  1.  372.1 658.9 255.    1.7]
 [  2.  303.5 665.9 125.    2. ]
 [  3.  218.4 597.9   8.    4.6]
 ...
 [234.  185.  655.  115.    nan]
 [235.  259.8 587.9 119.    2.1]
 [236.  260.8 668.6 107.    2.6]]

dat["January_temp"]

array([1.7, 2. , 4.6, nan, 3.1, 3.5, 3.4, 3. , 4.9, 2.9, nan, 1.3, nan,
       4. , 1.7, nan, 1.9, 3.3, 2.3, nan, 2.3, 2.6, nan, 2.7, 2.9, nan,
       1. , 1.2, nan, 3.1, nan, 3.7, 2.1, 2.5, 2.9, nan, nan, nan, 3.1,
       2.1, nan, 2.7, 3. , nan, nan, 1.8, nan, nan, 2.2, 2.9, 3.3, nan,
       5. , 1.6, nan, 2.1, 3.2, 4.2, 1.1, nan, 2.7, 0.6, 3.2, nan, 2.5,
       2. , 2.8, nan, 3.2, 3.2, 4.5, 3.3, 4.1, 2.2, 1.7, 4.3, 5.2, nan,
       1.6, 3.9, 3.1, nan, 3.5, 4.7, 3.6, nan, 1.8, 1.7, nan, nan, nan,
       nan, nan, nan, nan, 1.7, nan, 3. , 4.6, 3.9, 3.2, 1.3, nan, nan,
       nan, 4.7, nan, 2.6, 2. , 4.7, 1.2, 2.9, 0.9, 3. , nan, 3.6, 0.7,
       3.3, nan, nan, nan, 2.7, nan, 2.7, 2.4, nan, nan, 2. , 2.6, nan,
       4.3, nan, nan, nan, nan, 3.1, 3.4, 3.1, 2. , 1.3, 1.9, nan, 3.3,
       2.7, 4.4, nan, 3. , 0.9, 0.7, nan, 3.6, nan, 3.5, nan, 2.4, 1. ,
       nan, 3.6, nan, nan, nan, nan, 3. , nan, 3.5, 4. , 3. , 3.6, nan,
       3.2, 1.7, 2.7, 1.9, nan, nan, 4.4, 1.9, 3.3, nan, nan, 3.5, 1.7,
       3. , nan, 2.7, nan, 1. , 3.3, nan, nan, 3.2, 3.9, nan, nan, 3. ,
       nan, 3.8, nan, 2.8, nan, 2.9, 1.4, 2.6, 3. , nan, 2.8, 2.9, 3.6,
       nan, 2. , 4.6, 3.7, nan, nan, 4.5, 2.7, nan, 4.7, 1.7, 1.9, 3.5,
       nan, nan, nan, 2.1, 2.3, 3.1, nan, nan, 2. , 2.6, 2.8, 2.6, nan,
       2.1, 2.6])

dat[10:15, ["rank", "Latitude", "Elevation"]]

array([[ 11. , 865. ,  37. ],
       [ 12. , 602.6, 242. ],
       [ 13. , 835. , 295. ],
       [ 14. , 933.2,  15. ],
       [ 15. , 648.8, 183. ]])

dat[10:15, 2:4]

array([[865. ,  37. ],
       [602.6, 242. ],
       [835. , 295. ],
       [933.2,  15. ],
       [648.8, 183. ]])

dat.toTL()

dat["newvar"] = 12.3 * dat["Elevation"] - 2.1 * dat["*temp"]
dat

Data Base Characteristics
=========================

Data Base Summary
-----------------
File is organized as a set of isolated points
Space dimension              = 2
Number of Columns            = 6
Total number of samples      = 236

Variables
---------
Column = 0 - Name = rank - Locator = NA
Column = 1 - Name = Longitude - Locator = x1
Column = 2 - Name = Latitude - Locator = x2
Column = 3 - Name = Elevation - Locator = NA
Column = 4 - Name = January_temp - Locator = z1
Column = 5 - Name = newvar - Locator = NA

dat.deleteColumn("newvar")
dat.display()

Data Base Characteristics
=========================

Data Base Summary
-----------------
File is organized as a set of isolated points
Space dimension              = 2
Number of Columns            = 5
Total number of samples      = 236

Variables
---------
Column = 0 - Name = rank - Locator = NA
Column = 1 - Name = Longitude - Locator = x1
Column = 2 - Name = Latitude - Locator = x2
Column = 3 - Name = Elevation - Locator = NA
Column = 4 - Name = January_temp - Locator = z1

dat.setLocators(["Longitude","Latitude"], gl.ELoc.X)
dat.setLocator("January_temp", gl.ELoc.Z)
dat

Data Base Characteristics
=========================

Data Base Summary
-----------------
File is organized as a set of isolated points
Space dimension              = 2
Number of Columns            = 5
Total number of samples      = 236

Variables
---------
Column = 0 - Name = rank - Locator = NA
Column = 1 - Name = Longitude - Locator = x1
Column = 2 - Name = Latitude - Locator = x2
Column = 3 - Name = Elevation - Locator = NA
Column = 4 - Name = January_temp - Locator = z1

gl.ELoc.printAll()

  -1 -     UNKNOWN : Unknown locator
   0 -           X : Coordinate
   1 -           Z : Variable
   2 -           V : Variance of measurement error
   3 -           F : External Drift
   4 -           G : Gradient component
   5 -           L : Lower bound of an inequality
   6 -           U : Upper bound of an inequality
   7 -           P : Proportion
   8 -           W : Weight
   9 -           C : Code
  10 -         SEL : Selection
  11 -         DOM : Domain
  12 -        BLEX : Block Extension
  13 -        ADIR : Dip direction Angle
  14 -        ADIP : Dip Angle
  15 -        SIZE : Object height
  16 -          BU : Fault UP termination
  17 -          BD : Fault DOWN termination
  18 -        TIME : Time variable
  19 -       LAYER : Layer rank
  20 -      NOSTAT : Non-stationary parameter
  21 -        TGTE : Tangent
  22 -        SIMU : Conditional or non-conditional simulations
  23 -      FACIES : Facies simulated
  24 -     GAUSFAC : Gaussian value for Facies
  25 -        DATE : Date
  26 -       RKLOW : Rank for lower bound (when discretized)
  27 -        RKUP : Rank for upper bound (when discretized)
  28 -         SUM : Constraints on the Sum

fig, ax = gp.init()
gp.symbol(dat, nameColor="January_temp", flagLegendColor=True, legendNameColor="Temperature")
gp.decoration(title="January Temperature", xlabel="Easting", ylabel="Northing")

fig, ax = gp.init()
gp.symbol(dat, nameSize="Elevation", nameColor="*temp", flagLegendSize=True, legendNameSize="Elevation")
gp.decoration(title="January Temperature", xlabel="Easting", ylabel="Northing")

plt.figure(figsize=(20,8))
plt.scatter(dat["x1"], dat["x2"], s=20, c=dat["*temp"]) # Locator or variable name is OK
plt.title("January Temperatures")
plt.xlabel("Easting")
plt.ylabel("Northing")
plt.colorbar(label="Temperature (°C)")
plt.gca().set_aspect('equal') # Respect aspect ratio
plt.show()

elev_nf = gdoc.loadData("Scotland", "Scotland_Elevations.NF")
grid = gl.DbGrid.createFromNF(elev_nf)
grid

Data Base Grid Characteristics
==============================

Data Base Summary
-----------------
File is organized as a regular grid
Space dimension              = 2
Number of Columns            = 4
Total number of samples      = 11097
Number of active samples     = 3092

Grid characteristics:
---------------------
Origin :     65.000   535.000
Mesh   :      4.938     4.963
Number :         81       137

Variables
---------
Column = 0 - Name = Longitude - Locator = x1
Column = 1 - Name = Latitude - Locator = x2
Column = 2 - Name = Elevation - Locator = f1
Column = 3 - Name = inshore - Locator = sel

fig, ax = gp.init(figsize=(6,6), flagEqual=True)
gp.raster(grid, name="Elevation", flagLegend=True)
gp.decoration(title="Elevation", xlabel="Easting", ylabel="Northing")

fig, ax = gp.init(figsize=(6,6), flagEqual=True)
gp.raster(grid, name="Elevation", flagLegend=True)
gp.symbol(dat, nameSize="*temp", flagLegendSize=True, legendNameSize="Temperature", sizmin=10, sizmax=30, c="yellow")
gp.decoration(title="Elevation and Temperatures", xlabel="Easting", ylabel="Northing")

Table of Contents

Data Base¶

Main classes¶

Importing External File¶

Loading a CSV file¶

Creating Db object from a Pandas frame¶

Creating Db object directly from CSV file¶

Importing Db File from a "Neutral File"¶

Discovering Db¶

The Db class¶

Assessors for Db class¶

Locators¶

More with Db¶

Plotting a Db¶

Grid Data Base¶

Selection¶

Final plot¶

	Longitude	Latitude	Elevation	January_temp
0	372.1	658.9	255	1.7
1	303.5	665.9	125	2.0
2	218.4	597.9	8	4.6
3	245.0	955.0	90	NaN
4	326.8	691.2	32	3.1
...	...	...	...	...
231	273.2	564.6	47	2.8
232	333.9	730.1	30	2.6
233	185.0	655.0	115	NaN
234	259.8	587.9	119	2.1
235	260.8	668.6	107	2.6

	rank	Longitude	Latitude	Elevation	January_temp
0	1.0	372.1	658.9	255.0	1.7
1	2.0	303.5	665.9	125.0	2.0
2	3.0	218.4	597.9	8.0	4.6
3	4.0	245.0	955.0	90.0	NaN
4	5.0	326.8	691.2	32.0	3.1
...	...	...	...	...	...
231	232.0	273.2	564.6	47.0	2.8
232	233.0	333.9	730.1	30.0	2.6
233	234.0	185.0	655.0	115.0	NaN
234	235.0	259.8	587.9	119.0	2.1
235	236.0	260.8	668.6	107.0	2.6